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WPROWADZENIE 


PRZEZNACZENIE KSIĄŻKI 


Niniejsza książka jest przeznaczona dla osób, które chcą zapoznać się z budową i dzia- 
łaniem komputerów. Do dobrego zrozumienia tej książki nie jest wymagana żadna spec- 
jalistyczna wiedza, a zatem książka może być czytana przez każdego kto ma ogólne 
średnie wykształcenie. W książce nie wystarczyło miejsca, aby dostatecznie szeroko opra- 
cować wszystkie zagadnienia i dlatego w przypadku, gdy Czytelnik napotka trudniejsze 
fragmenty, to zaleca się sięgnięcie do odpowiedniej pozycji literatury, której spis umiesz- 
czono na końcu książki. Autor poleca książkę jako pomocną w procesie dydaktycznym 
w szkołach zawodowych i w uczelniach, a szczególnie uczniom i studentom, którzy mają 
zajęcia z informatyki. 


RYS HISTORYCZNY 


Budową urządzeń przeznaczonych do wspomagania obliczeń matematycznych zajmowano 
się od bardzo dawna. Maszyny obliczeniowe projektowali tacy wielcy matematycy jak 
Blaise Pascal (1623-1661), Gotfried Wilhelm von Leibnitz (1646-1716), Joseph Marie 
Jacquard (1752-1832), Charles Babbage (1792-1871) i inni. Projekty tych aparatów 
polegały zwykle na konstruowaniu bardzo skomplikowanych urządzeń mechanicznych. 
Ale już wtedy wiele koncepcji zawierało myśl o prowadzeniu obliczeń według pamiętanego 
w maszynie programu. Rozwiązania mechaniczne nie pozwalały na budowę efektywnych 
urządzeń. Dopiero pomysł wykorzystania elementów elektromechanicznych (przekaźni- 
ków) doprowadził Howarda Aikena do pomyślnej realizacji urządzenia o nazwie MARK I, 
którego budowę sponsorował koncern IBM. Praca ta rozpoczęła się w latach trzydziestych, 
ale uruchomienie urządzenia nastąpiło w roku 1944 i jemu przyznaje się miano pierwszego 
komputera. Jednak w tym samym czasie profesor uniwersytetu w Jowa John Atanasoff 
wraz z asystentem Cliffordem Berry pracowali nad modelem aparatu obliczeniowego 
wykorzystującego lampy elektronowe. Model ten nie znalazł zastosowania. Natomiast 
John Presper Eckert i John Mauchly z Moore School of Electrical Engineering (University 
of Pennsylvania) w roku 1946 zaprojektowali i uruchomili pierwszą elektroniczną maszynę 
matematyczną o nazwie ENIAC (Electronic Numerical Integrator and Computer), którą 
wykorzystano między innymi do obliczeń balistycznych. ENIAC był maszyną zawierającą 
18 tysięcy lamp elektronowych i 1500 przekaźników. Ważył on 30 ton i zajmował po- 
wierzchnię 1000 m”. Maszyna pobierała ogromną moc ponad 140 kW, a szybkość obliczeń 
wynosiła zaledwie 5000 dodawań na sekundę. Natomiast od chwili skonstruowania Eniaca 
datuje się początek ery komputerów. Powstała nowa, ale bardzo dynamicznie rozwijająca 
się dziedzina techniki — zwana dziś informatyką. 


W Polsce komputery nazywano początkowo maszynami matematycznymi i dopiero 
stosunkowo od niedawna przyjęła się spolszczona nazwa angielskiego słowa computer. 


2 1. Wprowadzenie 


Natomiast dziedzinę wiedzy zajmującą się budową i wykorzystywaniem komputerów 
nazwano informatyką. W krajach anglosaskich nosi ona nazwę computer science lub 
computer engineering. Za twórców tej nauki uważa się Amerykanina Johna von Neumana 
i Anglika Alana Turinga. Niezależnie od siebie podali oni dwie różne koncepcje budowy 
maszyn obliczeniowych, automatycznie wykonujących wcześniej zadany program. W reali- 
zacjach technicznych powszechnie przyjęła się koncepcja von Neumana i można stwier- 
dzić, że znakomita większość budowanych dotąd komputerów wykorzystywała podaną 
przez niego architekturę. Architektura oznacza koncepcję działania, a szerszą definicję 
tego pojęcia można znaleźć na końcu niniejszego rozdziału. 


Pierwsze komputery budowano na skalę przemysłową już w latach czterdziestych. 
Powstawały one w pojedynczych egzemplarzach i dlatego były bardzo drogie. Były to 
komputery lampowe (zbudowane z lamp elektronowych) zwane komputerami pierwszej 
generacji. Wykorzystywanie ich było utrudnione, gdyż jedynym językiem programowania 
był tzw. język maszynowy. Program i dane były wprowadzane do pamięci w postaci zer 
1 jedynek. | 


W roku 1949 wynaleziono tranzystor, który bardzo szybko znalazł zastosowanie 
w komputerach. Dlatego lata pięćdziesiąte, to lata drugiej generacji komputerów — kom- 
puterów tranzystorowych. Technologia ta umożliwiała wydłużenie serii produkowanych 
maszyn, co pozwoliło obniżyć ich cenę. Wprowadzono także translatory, czyli programy 
tłumaczące język używany przez programistów na język maszynowy. Zadaniem transla- 
torów było ułatwienie pracy programistom przy pisaniu programów. Ułatwienie polegało 
na wprowadzeniu języków programowania wyższego poziomu niż język maszynowy. 
Powstały języki asemblerowe, w których zero-jedynkowe kody instrukcji maszynowych 
zastąpiono kodami mnemonicznymi. Na przykład zero-jedynkowy kod maszynowy ope- 
racji dodawania zastąpiono literami ADD, co w języku angielskim oznacza dodawanie. 
Zadaniem translatora było zamienienie ciągu 3 liter ADD na odpowiednie słowo zero- 
-jedynkowe kodu maszynowego. W drugiej generacji komputerów ich pamięci główne 
(czyli tzw. pamięci operacyjne) realizowane były jako pamięci ferrytowe, tzn. budowane 
na magnetycznych rdzeniach toroidalnych. Pamięciami pomocniczymi były pamięci 
bębnowe, a pamięciami zewnętrznymi pamięci na taśmach magnetycznych (w różnych 
odmianach stosowane do dzisiaj). Pamięci pomocnicze i pamięci zewnętrzne nazwano 
pamięciami masowymi ze względu na możliwość zapamiętywania dużej ilości informacji. 
Wprowadzanie programów i danych odbywało się najczęściej poprzez taśmę papierową. 
Komputery były wyposażane w bardzo zawodne i wolne urządzenia wejściowe i wyjściowe 
jakimi były czytniki i perforatory taśmy papierowej. Stosowano także dalekopisy jako 
urządzenia operatorskie, a wyniki drukowano na drukarkach. Koszt takich komputerów 
wynosił setki tysięcy dolarów. Największą część tego kosztu stanowił koszt montażu. 
Typowy komputer składał się z dziesiątek tysięcy tranzystorów i z setek tysięcy rezystorów 
I kondensatorów. Połączenie tych elementów ze sobą było wykonywane ręcznie, wymagało 
żmudnego sprawdzania i nie pozwalało na osiągnięcie dużej niezawodności. Zmuszało to 
konstruktorów do poszukiwania innych rozwiązań. Poszukiwania te doprowadziły techno- 
logów do opracowania układów scalonych. 


Irzecia generacja komputerów powstała w połowie lat sześćdziesiątych kiedy zaczęto 
stosować układy scalone tzw. małej skali integracji, tj. układy SSI (ang. small scale 
integration) 1 średniej skali integracji, tj. układy MSI (ang. medium scale integration). 
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Technologia wykorzystująca układy scalone umożliwiła nie tylko znaczne zmniejszenie 
gabarytów komputerów, zmniejszenie poboru mocy, zwiększenie niezawodności, ale 
i znaczne zwiększenie długości produkowanych serii. Niektóre typy komputerów wytwa- 
rzano w setkach sztuk rocznie, co wówczas było zawrotną wielkością. Taka długość serii 
umożliwiła znaczne obniżenie ceny, aż do ok. 10 tysięcy dolarów za sztukę. Takie kom- 
putery zaczęto nazywać minikomputerami. 


Coraz powszechniej jako pamięci operacyjne zaczęto stosować pamięci półprzewod- 
nikowe, a jako pamięci pomocnicze — pamięci dyskowe. Konsolę operatorską budowano 
w postaci tzw. terminala, czyli urządzenia składającego się ze specjalnej klawiatury 1 moni- 
tora ekranowego wykonanego z użyciem lampy telewizyjnej. Wkrótce potem powstały 
komputery umożliwiające pracę wielodostępną z wielu terminali jednocześnie. Nastąpił 
także rozwój języków programowania wyższego rzędu i ich translatorów. Komputery 
zaczęły stawać się systemami złożonymi z dwóch nierozerwalnych elementów: sprzętu 
(ang. hardware) i oprogramowania (ang. software). W skład oprogramowania firmowego 
weszły programy tworzące tzw. system operacyjny, którego funkcją stało się zarządzanie 
pracą komputera, a w szczególności optymalizacja wykorzystania poszczególnych jego 
elementów. Umożliwiał on także jednoczesne wykonywanie wielu programów, czyli tzw. 
pracę wieloprogramową. Oprogramowanie firmowe zawierało także translatory (tzw. kom- 
pilatory i interpretery) języków wysokiego poziomu jak: Algol, Fortran, Cobol i inne. 


Czwarta generacja komputerów powstała w połowie lat siedemdziesiątych po wpro- 
wadzeniu do masowej produkcji układów scalonych wielkiej i bardzo wielkiej skali inte- 
gracji, tj. układów LSI (ang. large scale integration) i układów VLSI (ang. very large 
scale integration). Wówczas rozpoczęła się era mikrokomputerów. Przedrostek mikro 
oznacza fakt, że cały procesor komputera scalono w jednej obudowie. Ale oprócz mikro- 
komputerów, w tym samym czasie powstały także superkomputery, czyli duże i drogie 
komputery o bardzo wielkiej mocy obliczeniowej. Natomiast serie produkcyjne mikro- 
komputerów wydłużyły się do setek tysięcy sztuk 1 ich cena spadła do ok. tysiąca dolarów. 
Taki komputer mógł stać się narzędziem osobistym. Pamięci operacyjne dało się złożyć 
z kilku układów scalonych. Pamięci dyskowe o dużych pojemnościach miały wielkość 
książki. Jako pamięci zewnętrzne rozpowszechniły się pamięci na dyskach elastycznych 
(ang. floppy disk), tzw. dyskietkach. Rozpoczął się także okres bardzo dynamicznego 
rozwoju przemysłu produkującego oprogramowanie. Powstawały zarówno systemy opera- 
cyjne (DOS, VRMX, UNIX itd.), języki programowania (C, MODULA, PASCAL itd.), 
jak 1 oprogramowanie dla konkretnych zastosowań (systemy wspomagające projektowanie 
CAD/CAM, edytory tekstów, oprogramowanie biurowe itd.). Podobnie w superkompu- 
terach zastosowano technologie, które pozwoliły na osiągnięcie bardzo dużych szybkości 
działania i pamiętania bardzo wielkiej ilości informacji. Komputery te produkowane 
w stosunkowo niewielkiej liczbie sztuk, są drogie, choć cenę rekompensują bardzo dobre 
parametry funkcjonalne i techniczne. 


W połowie lat osiemdziesiątych rozpoczęła się era piątej generacji. Rozwój technik 
komputerowych przebiegał w kilku kierunkach. Jednym z nich było poszukiwanie nowych 
architektur, jak na przykład komputery RISC (ang. reduced instruction set computers), 
architektury potokowe czy systemy wieloprocesorowe. Innym ważnym kierunkiem rozwoju 
informatyki jest budowanie dużych systemów komputerowych, jak np. superkomputerów 
czy też lokalnych lub rozległych sieci komputerowych. Jeszcze innym kierunkiem był 
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rozwój technik mikrokomputerowych, w tym także obejmujący mikroprocesory specjali- 
zowane, a w szczególności procesory przeznaczone do grafiki komputerowej i do prze- 
twarzania sygnałów analogowych. 


Dziś przemysł komputerowy rozwija się nadal bardzo dynamicznie. Stymuluje on 
także rozwój wielu gałęzi techniki. W szczególności dotyczy to mikroelektroniki i innych 
dziedzin technologii elektronicznych. Ale trudno byłoby także wskazać taką dziedzinę 
życia, gdzie nie dotarły zastosowania komputerów. Dla różnych zastosowań powstają 
nowe specjalizowane opracowania systemów komputerowych i nowe urządzenia z nimi 
współpracujące. Przykładowo: 

— zastosowania poligraficzne: 

— sprzęt specjalizowany: skanery (urządzenia do przetworzenia obrazów na postać 
cyfrową) i naświetlarki (urządzenia do naświetlania klisz służących dalej w pro- 
cesie drukowania), 

— oprogramowanie: edytory tekstowe i edytory graficzne; 

— zastosowania handlowe: 

— sprzęt specjalizowany: kasy sklepowe i czytniki kart kredytowych, 

— oprogramowanie: systemy zaopatrzenia magazynów, systemy podatkowe, bilanso- 
we, księgowe; 

— zastosowania bankowe: 

— sprzęt specjalizowany: bankomaty, automaty do liczenia pieniędzy, czytniki pod- 
pisów itp., 

— oprogramowanie: sprawdzanie kont kredytowych, kontrolery kursów walut i pa- 
pierów wartościowych, systemy prognozowania; 

— inne zastosowania jak np. zastosowania do sterowania procesami przemysłowymi 

i obiektami specjalnymi (samolotami), do analizy sygnałów analogowych (analiza 

i synteza mowy), systemy alarmowe i zabezpieczające, systemy wojskowe. 


Każde z wymienionych zastosowań narzuca komputerom nieco inne wymagania i ich 
konstruktorzy stają przed problemem konfliktu pomiędzy uniwersalnością rozwiązań (niska 
cena) a specjalizacją rozwiązań. Jednym z nurtów prowadzących do rozstrzygnięć tych 
konfliktów są poszukiwania z zakresu architektury komputerów. 


ARCHITEKTURA 


Co nazywamy architekturą komputerów? Słowo zaczerpnięte z budownictwa ma oddać 
złożoność tego obiektu technicznego. Tak jak wielki biurowiec, tak i komputer jest bardzo 
złożonym obiektem. Jego projektowanie, a następnie opisywanie, odbywa się na różnych 
poziomach. W szczególności wyróżnić można 3 poziomy opisu komputera: architekturę, 
implementację i realizację. Każdemu z tych trzech poziomów można przypisać odpo- 
wiednio jedno z trzech pytań: „co robi?”, „jak działa?” i „z czego jest zrobiony? ”. 
Prawdopodobnie pojęcie architektury po raz pierwszy wprowadził Buchholz kiedy w roku 
1962 opisywał komputer firmy IBM o nazwie Stretch. W roku 1964 Amdhal zdefiniował 
architekturę komputerów jako „funkcjonalny wygląd komputera przeznaczony dla jego 


bezpośrednich użytkowników”. Opis architektury komputera ma odpowiedzieć na pytanie 
„co robi?”. 


Implementacja, czasem nazywana organizacją komputerów, jest opisem sposobu w jaki 
ten „funkcjonalny wygląd” zrealizowano. Projektant, na tym poziomie, dokonuje wyboru 
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sposobu połączeń pomiędzy blokami, sposobu kodowania przesyłanej informacji, wyboru 
zasady działania układów sterujących itp. Zatem daną architekturę można różnie zapro- 
jektować, czyli może mieć ona różne implementacje. Opis implementacji ma dać od- 
powiedź na pytanie „jak działa?” dany komputer. 


Realizacją można nazwać konkretną postać implementacji. Na poziomie realizacji 
projektant może dokonać wyboru elementów, z których będzie budowany dany komputer, 
różnego ich rozmieszczenia, zasilenia, chłodzenia, ekranowania itp. Dlatego daną imple- 
mentację można też na różne sposoby zrealizować. Opis realizacji odpowiada na pytanie 
„Z czego jest zrobiony? dany komputer. 


PARAMETRY KOMPUTERÓW 


Współczesne komputery różnią się między sobą parametrami. Niektóre z nich to: moc 
obliczeniowa liczona w liczbie operacji na jednostkę czasu np. MIPS (ang. mega- 
-instruction per second) lub dla operacji zmiennopozycyjnych MFLOPS (ang. mega 
floating point operations per second), szybkość transmisji danych do różnych urządzeń 
liczona w kilobajtach na sekundę (kB/s), pobierana moc mierzona w watach, niezawodność 
itp. Bardzo ważnym parametrem jest także koszt. Projektowanie komputerów to ciągły 
proces poszukiwania kompromisu pomiędzy parametrami a kosztem. Obecna technologia 
pozwala na budowanie komputerów o bardzo wielkich możliwościach. Jednak koszt takich 
urządzeń jest bardzo duży. I odwrotnie, w wielkich seriach budowane są bardzo tanie 
komputery o niezbyt wygórowanych parametrach. 


Sądzę, że po zapoznaniu się z treścią niniejszej książki Czytelnik lepiej zrozumie sens 
podanych stwierdzeń. 


ZAWARTOŚĆ KSIĄŻKI 


W rozdziale drugim niniejszej książki wyjaśniono ogólną koncepcję klasycznego kompu- 
tera o architekturze von Neumana. 


W rozdziale trzecim przedstawiono podstawy techniki cyfrowej, które stanowią wstęp 
do zrozumienia budowy klasycznego komputera. Najpierw omówiono elementy, z których 
składane są poszczególne bloki komputera, działanie tych elementów a także pokazano 
sposoby ich łączenia i wykorzystania. W dalszej części tego rozdziału zaprezentowano 
niektóre kody liczbowe oraz przedstawiono zasady wykonywania operacji arytmetycznych 
na liczbach binarnych. 


W następnych trzech rozdziałach opisano budowę trzech podstawowych bloków kom- 
putera. W rozdziale czwartym przedstawiono zasady działania procesorów. Pokazano ich 
organizację, przeznaczenie poszczególnych bloków, kolejne fazy wykonywania programu 
i współpracę procesora z pamięcią operacyjną i urządzeniami zewnętrznymi. Przedstawio- 
no tam także zbiór rozkazów typowego komputera i tryby adresowania argumentów dla 
tych rozkazów. Rozdział piąty jest poświęcony pamięciom, ich rodzajom, parametrom 
i hierarchii ich usytuowania w komputerach. W rozdziale szóstym opisano podstawowe 
sposoby współpracy urządzeń zewnętrznych z procesorem i z pamięcią operacyjną. Przed- 
stawiono także prostą klasyfikację urządzeń zewnętrznych oraz organizację transmisji 
danych. 
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W rozdziale siódmym omówiono niektóre zagadnienia programowania na najniższym 
poziomie, jak np. wywołania podprogramów i zasadę translacji programów. Przedstawiono 
tam także zadania i funkcje systemów operacyjnych oraz ich powiązanie ze sprzętem. 


Ostatni ósmy rozdział książki poświęcono pewnym problemom związanym z archi- 
tekturą współczesnych komputerów. W rozdziale tym podano klasyfikację systemów kom- 
puterowych oraz przedstawiono mechanizmy pozwalające na przyspieszenie pracy kom- 
puterów. Pokrótce omówiono architektury potokowe, architektury typu Harvard i RISC, 
a także omówiono systemy wieloprocesorowe. 


Niniejsza książka może dać Czytelnikowi podstawy do zrozumienia zasad budowy 
i działania komputerów, a przedstawione tu zagadnienia mogą stanowić punkt wyjścia do 
dalszego zaznajamiania się z tą tematyką. 


ARCHITEKTURA 
KLASYCZNYCH KOMPUTERÓW 


Klasyczny komputer o architekturze podanej przez von Neumana składa się z trzech 
podstawowych bloków: procesora, pamięci i urządzeń do wprowadzania danych i progra- 
mów oraz do wyprowadzania wyników (rys. 2.1). Urządzenia wprowadzania i wyprowa- 
dzania danych będą dalej nazywane urządzeniami zewnętrznymi lub urządzeniami wejścia- 
-wyjścia (skrótowo urządzenia we/wy — ang. I/O devices). Osoba posługująca się 
komputerem, którą nazywać będziemy operatorem, ma bezpośredni dostęp tylko do urzą- 
dzeń zewnętrznych. W wielu komputerach urządzeniami tymi są klawiatura (urządzenie 
wejściowe) i monitor ekranowy (urządzenie wyjściowe). Wypisując na klawiaturze w od- 
powiedniej kolejności odpowiednie znaki, zwane dalej znakami alfanumerycznymi, opera- 
tor może do pamięci komputera zapisać program i dane potrzebne do wykonania tego 
programu. Program jest ciągiem poleceń wydawanych procesorowi. Poszczególne polece- 
nia dotyczą odpowiednich danych. Dane te, zwane dalej argumentami, mogą znajdować 
się w pamięci, mogą znajdować się też w samym procesorze (tzn. w jego rejestrach), 
a mogą także zostać wprowadzone przez operatora w programie. 


Procesor 


Rysunek 2.1. Ogólny schemat blokowy komputera 


Po załadowaniu programu do pamięci komputera może on zostać w dowolnej chwili 
wywołany przez operatora. W tym celu musi on wydać polecenie rozpoczęcia wykonywa- 
nia tego programu przez wymuszenie odczytania pierwszego polecenia tego programu. 
W tym celu należy spowodować, aby procesor wysłał do pamięci odpowiedni adres. 
Dalsze polecenia umieszczone są w pamięci kolejno, więc będą odczytywane przez proce- 
sor automatycznie. Wykonywanie programu polega więc na pobieraniu z pamięci kolejnych 
poleceń i odpowiednich dla tych poleceń argumentów. Dlatego program stanowi odpowied- 
nio ułożony ciąg poleceń i argumentów. Polecenia nazywać będziemy dalej zamiennie 
rozkazami lub instrukcjami. Niektórzy autorzy rozróżniają te pojęcia i rozkazem nazywają 
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słowo kodowe wskazujące na rodzaj wykonywanej operacji. Ponieważ jednak dla wielu 
operacji w komputerze należy wskazać także argumenty dla nich, to rozkazy uzupełnione 
muszą zostać wskazaniem miejsca argumentów. Rozkaz wraz z takim uzupełnieniem 
nazywają wtedy instrukcją. 


Jak już wcześniej powiedziano argumenty rozkazu mogą być: 

1) w pamięci i wówczas rozkaz musi zawierać adres miejsca w pamięci, gdzie one 
się znajdują; 

2) w rejestrach procesora i wówczas rozkaz musi wskazywać adres odpowiedniego 
rejestru; 

3) w samym rozkazie i wówczas programista umieszcza je w odpowiednio w kodzie 
programu. 


W czasie wykonywania programu procesor odczytuje kolejne rozkazy, które następnie 
musi rozpoznać (dekodować). Po zdekodowaniu rozkazu, w zależności od treści tego 
rozkazu, procesor podejmuje odpowiednią akcję. Akcja ta polega na wykonaniu 
odpowiedniej operacji. Między innymi, z treści rozkazu, może wynikać konieczność 
odczytania argumentów dla niego. Jeżeli argument znajduje się w pamięci, to dalsza akcja 
polega na odczytaniu adresu tego argumentu. Jeżeli adres ten programista umieścił w ko- 
dzie programu, to odczytane będzie następne słowo(a) z kodu programu stanowiące ten 
adres. Jeżeli argument znajduje się w rejestrze procesora, to rozkaz musi wskazać, w któ- 
rym z rejestrów procesora znajduje się adres. Po skompletowaniu całej instrukcji procesor 
wykonuje ją, a dalej pobiera następny rozkaz 1 cała akcja się powtarza. Zanim podany opis 
zostanie zilustrowany przykładem, przedstawione zostaną nieco dokładniej dwa spośród 
trzech bloków komputera: procesor i pamięć. 


x adres 
— pamięci 


wynik 
operacji 


sygnały sterujące 


Dekoder 


Rysunek 2.2. Uproszczony schemat procesora 


Na rysunku 2.2 pokazano uproszczony schemat blokowy typowego procesora. Typowa 
organizacja procesora to blok rejestrów (na rys. 2.2 jest ich 4), blok ALU i dekoder kodu 
rozkazowego. Najważniejszym układem procesora jest blok arytmetyczno-logiczny ALU 
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wykonujący operacje na argumentach z dwóch rejestrów A i B. Cykl pracy procesora 
rozpoczyna się od wysłania do pamięci adresu rozkazu. Adres ten znajduje się w rejestrze 
LR zwanym licznikiem rozkazów. Odczytywany z pamięci rozkaz zostaje przesłany do 
rejestru rozkazów RR. Zawartość tego rejestru jest dekodowana i blok ALU zostaje 
odpowiednio wysterowany do wykonania danej operacji. Zarówno rozkazy procesora jak 
i argumenty tych rozkazów są przedstawiane w komputerze w postaci słów binarnych, 
tj. kodowane w zapisie dwójkowym. Słowo binarne jest to ciąg uporządkowanych bitów 
czyli cyfr dwójkowych. Długość tego ciągu może być różna, choć w komputerach 
najczęściej jest wielokrotnością liczby 8 (słowo 8-bitowe nazywane jest z angielskiego 
bajtem — ang. byte) i wynosi najczęściej 8, 16, 32 i 64. Mówi się wówczas o komputerach 
6-, 16-, 32- czy 64-bitowych w zależności od tego jak długimi słowami operują. Długość 
słowa procesora narzuca także wielkość rejestrów (rejestry A i B są zwykle takiej samej 
długości), a ponadto stanowi pewien wskaźnik dokładności obliczeniowej. Zwiększenie 
dokładności wymaga posługiwania się słowami dłuższymi. Dlatego często w komputerach 
o niewielkiej długości słowa, np. w mikroprocesorach 8-bitowych, istnieje możliwość 
reprezentacji liczb dwoma lub więcej słowami. 


adres 8 bitów 
O 
1 
2 
3 NIS 
4 WE Pamięć WY 
0/Z 

n-4 adres 

n-3 

n-2 

n-1 


Rysunek 2.3. Struktura pamięci o pojemności n słów 8-bitowych 


Na rysunku 2.3 pokazano strukturę pamięci 8-bitowej o liczbie słów równej n. Pamięć 
jest podzielona na komórki, w których są przechowywane pojedyncze słowa (bajty). 
Każda komórka ma swój adres i podanie tego adresu na wejście adresowe pamięci umoż- 
liwia dostęp do danej komórki, czyli odczyt lub zapis. W zależności od sygnału O/Z 
pamięć jest odczytywana lub zapisywana. Wielkość takiej pamięci nazywana jest pojem- 
nością pamięci i jest oznaczana przez nx8 (liczba pamiętanych słów przez długość słowa). 
W jednym cyklu pracy takiej pamięci można odczytać lub zapisać tylko słowo 8-bitowe. 
W przypadku gdy długość rozkazu lub argumentu jest większa, to jest on zapisywany 
w dwóch (lub więcej) komórkach pamięci. 


Rozpatrzmy teraz prosty program napisany na trzy różne sposoby. Na rysunku 2.4 
przedstawiono ten program w językach trzech różnych poziomów. Na rysunku 2.4a przed- 
stawiono program i jego przykładowe ułożenie w pamięci komputera. Jest to postać 
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adres komórki zawartość komórki 


0000 0000 1011 0001 

0000 0001 0000 0101 | KDE SA) 
0000 0010 1010 0000 

0000 0011 0000 0000 

0000 0100 0000 1111 

0000 0101 0000 0000 | 
0000 0110 1100 1000 

0000 0111 1110 0110 | 


0000 1000 1010 1010 
| 
| 


| 
0000 1111 0000 0010 


MOV A, [B2, B3] A=A+5 


ADD CL,A 


OUT [B2] PRINT 


Rysunek 2.4. Przykładowy program dodawania 


programu w języku wewnętrznym (postać zero-jedynkowa) komputera. Na rysunku 2.4b 
przedstawiono ten sam program w tzw. języku asemblerowym. Jest to postać wykorzystu- 
jąca mnemoniczny zapis rozkazów. Na rysunku 2.4c przedstawiono postać tego programu 
w języku wysokiego poziomu (np. FORTRAN). Zadaniem translatora języka FORTRAN, 
jak i translatora języka asemblera, jest konwersja programu na postać w języku we- 
wnętrznym. Program dodaje dwie liczby i wydrukowuje wynik (najlepiej widać to na 
rys. 2.4c). Wprowadzono dodatkowo trzy założenia. Po pierwsze założono, że jeden ze 
składników sumy (w przykładzie liczba 0000 0101) będzie wprowadzany przez progra- 
mistę, a więc znajdzie się w kodzie programu. Po drugie założono, że drugi składnik sumy 
już wcześniej zapisano pod znany adres (np. 0000 0000 0000 1111). Po trzecie założono, 
że adres drukarki jest 1010 1010. 


Jak program taki może być zapisany w pamięci? Pierwszym rozkazem programu jest 
rozkaz zapisania do jednego z rejestrów procesora pierwszego składnika sumy. Jest to 
rozkaz o kodzie mnemonicznym MOV (ang. move — prześlij). W popularnym komputerze 
IBM PC jego kod binarny jest 1011 0001. Trzy ostatnie bity (001) wskazują na rejestr (jest 
to rejestr CL), do którego ma zostać przesłana wartość. Kod ten wskazuje także na to, że 
następny bajt programu (następna komórka pamięci) ma być interpretowany nie jako 
rozkaz, a jako argument tej operacji. W tym przypadku oznacza to, że do rejestru CL ma 
zostać zapisany ten argument, czyli liczba 5. Całkowita długość tej instrukcji wynosi 
zatem 2 bajty. Trzeci bajt programu jest ponownie bajtem rozkazu MOV. 


Inny kod tego rozkazu (1010 0000) wskazuje na to, że przesłanie ma nastąpić do 
innego rejestru (ostatnie trzy bity, tj. 000 wskazują, że jest to rejestr A) i że argument tej 
operacji znajduje się w komórce pamięci. Adresem tej komórki są dwa następne bajty 
kodu programu (w naszym przykładzie są to bajty 0000 0000 i 0000 1111). Zatem cała 
instrukcja ma długość trzech bajtów, a w wyniku jej wykonania w rejestrze A zostanie 
umieszczona wartość 2 (zawartość komórki pamięci o podanym adresie). Trzecim 
rozkazem jest rozkaz dodawania (mnemoniczne ADD). Kod 0000 0000 mówi o tym, że 
jest to instrukcja dwubajtowa. Drugi bajt instrukcji wskazuje miejsce skąd należy odczytać 
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argumenty. Dwie pierwsze jedynki drugiego bajtu wskazują na to, że argumenty znajdują 
się w rejestrach procesora i że do drugiego z nich ma zostać zapisany wynik. Pozostałe 
bity określają te rejestry (pierwszym jest rejestr CL — bity 001, drugim jest rejestr A — 
bity 000). Wynik (liczba 7) zostanie wpisany do drugiego rejestru (do rejestru A). Ostatni 
rozkaz jest też rozkazem dwu bajtowym. Jest to rozkaz przesłania zawartości rejestru A do 
urządzenia wyjściowego umieszczonego pod adresem 1010 1010 (drugi bajt tej instrukcji). 
W wyniku działania tego programu drukarka wydrukuje liczbę 7. 


Po tym ogólnym opisie warto przyjrzeć się nieco dokładniej kiedy i jak poszczególne 
bloki procesora uczestniczą w wykonywaniu tego programu. Inicjalizacja wykonania pro- 
gramu polega na odpowiednim załadowaniu licznika rozkazów LR. Należy wpisać do 
niego taką wartość, która wskaże miejsce w pamięci, gdzie znajduje się pierwszy rozkaz 
programu. W przykładzie jest to adres 0000 0000. Następuje wtedy faza odczytania rozkazu 
z pamięci. Nazywa się ona fazą pobrania rozkazu. W fazie tej odczytany z pamięci kod 
rozkazu zostaje zapisany do rejestru rozkazów (rejestr RR). Zawartość tego rejestru jest 
przesyłana do układu dekodera, który ma uruchomić odpowiedni proces wykonania tego 
rozkazu. Dekodowanie rozkazu polega głównie na rozpoznaniu: „co rozkaz ma zrobić?” 
(jaka to ma być operacja) i „jak ma zrobić?” (jakie są argumenty danej operacji). Pierwszy 
rozkaz naszego programu ma za zadanie przesłanie argumentu do rejestru CL. Jedno- 
cześnie wskazuje on, że argumentem tym będzie następny bajt kodu programu. Dlatego 
następuje teraz druga faza wykonania tego rozkazu, tj. pobranie argumentu. Licznik 
rozkazów zostaje zwiększony o 1 i odczytana zostanie następna komórka pamięci. Po 
skompletowaniu całej instrukcji nastąpi trzecia i ostatnia faza, zwana fazą wykonania 
rozkazu i wówczas argument operacji, zgodnie z treścią rozkazu, zostanie przesłany do 
rejestru CL. 


Ponieważ na tym zakończyło się wykonywanie tego rozkazu, to gdy licznik rozkazów 
zostanie ponownie zwiększony o 1 i odczytana zostanie zawartość następnej komórki 
pamięci, to będzie ona traktowana jako kod rozkazu i zostanie przesłana do rejestru 
rozkazów. W tym przypadku dekodowanie tego rozkazu pokaże, że jest to rozkaz prze- 
słania do rejestru A argumentu, który znajduje się w pamięci, a adres komórki pamięci 
znajduje się w kodzie programu w następnych dwóch bajtach. Dlatego po fazie pobrania 
kodu rozkazu nastąpi faza pobrania adresu argumentu. Zawartość licznika rozkazów zo- 
stanie zwiększona o 1 i odczytany zostanie pierwszy bajt adresu, a następnie zawartość LR 
zostanie jeszcze raz zwiększona o 1 i odczytany drugi bajt adresu. Wtedy nastąpi faza 
pobrania argumentu. Dwa bajty przesłane będą na wejście adresowe pamięci i odczytany 
zostanie argument tego rozkazu. Potem nastąpi ostatnia faza wykonania tego rozkazu, tj. 
przesłanie argumentu do rejestru A. Po zwiększeniu zawartości licznika rozkazów o 1 
odczytana z pamięci zawartość komórki pamięci będzie interpretowana jako rozkaz. Kod 
tego rozkazu (0000 0000) wskazuje, że jest to rozkaz dodawania zawartości dwóch 
rejestrów. Które z rejestrów procesora przechowują argumenty operacji wskazuje następny 
bajt kodu programu. Dlatego następuje zwiększenie zawartości licznika rozkazów o 1 
i bajt ten zostanie odczytany. Po tych dwóch odczytach pamięci zakończono fazę pobrania 
rozkazu i następuje faza pobrania argumentów. Drugi bajt rozkazu wskazuje na to, że 
argumentami są rejestry CL (bity 001) i A (bity 000), a wynik ma zostać przesłany do 
drugiego rejestru (rejestru A). W fazie wykonania rozkazu zawartości tych dwóch rejestrów 
zostaną podane na wejścia układu ALU, a wynik operacji zostanie przesłany do rejestru A. 
Po zwiększeniu zawartości licznika rozkazów o 1, nastąpi faza pobrania ostatniego roz- 
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kazu. Zdekodowana zawartość przedostatniego bajtu naszego programu wskaże, że jest to 
rozkaz OUT. Jest to rozkaz wysłania zawartości rejestru A do urządzenia wyjściowego 
(drukarki), którego adres jest podany w następnym bajcie rozkazu. Zawartość licznika 
rozkazów zostanie zwiększona o 1 i adres ten zostanie odczytany. Nastąpi ostatnia faza, tj. 
wykonanie rozkazu i zawartość rejestru A zostanie wysłana do drukarki. 


a Dekodowanie 
rozkazu 
Faza Faza Faza 
pobrania pobrania wykonania 
rozkazu argumentu rozkazu 
Cykl | Cykl | | 
maszynowy maszynowy 
| Cykl instrukcyjny > 
b Dekodowanie 
rozkazu 
Faza Faza Faza Faza Faza 
pobrania pobrania pobrania pobrania wykonania 
kodu rozkazu bajtu adresu bajtu adresu argumentu rozkazu 


Cykl instrukcyjny 


Rysunek 2.5. Sekwencje czynności procesora w czasie wykonywania instrukcji 


Na rysunku 2.5a pokazano symbolicznie sekwencję czynności komputera w czasie 
wykonywania pierwszego rozkazu programu, a na rysunku 2.5b drugiego rozkazu. 
Całkowity czas wykonywania instrukcji jest nazywany cyklem instrukcyjnym (rozkazo- 
wym). Każdy dostęp do pamięci jest nazywany cyklem maszynowym. Z rysunku 2.5 
widać, że cykle instrukcyjne mogą być różnej długości i składają się z różnej liczby cykli 
maszynowych. Cykl instrukcyjny pokazany na rysunku 2.5a składa się z dwóch cykli 
maszynowych, a cykl instrukcyjny z rysunku 2.5b z czterech. Czynności procesora, które 
nie wymagają dostępu do pamięci (dekodowanie rozkazu i wykonywanie rozkazu) trwają 
krócej. Niekiedy wykonywane są one w czasie cyklu maszynowego, gdyż angażują inne 
bloki procesora niż potrzebne do współpracy z pamięcią. Faza pobrania pierwszej instrukcji 
składa się z fazy pobrania kodu rozkazu i fazy pobrania argumentu, tj. z dwóch odwołań 
do pamięci. Faza pobrania drugiej instrukcji składa się z 4 odwołań do pamięci. Z po- 
równania wykresów z rysunków 2.5a i 2.5b wynika, przy założeniu, iż czas dekodowania 
rozkazu i czas wykonania rozkazu jest znacznie mniejszy od czasu cyklu pamięci (założe- 
nie to jest w większości rzeczywistych przypadków prawdziwe), że cykl instrukcyjny 
rozkazu drugiego będzie ok. 2 razy dłuższy niż cykl instrukcyjny rozkazu pierwszego. 


Opisany program operował słowami 8-bitowymi. Przykładowy procesor komputera 
osobistego IBM PC operuje także słowami 16-bitowymi. Wówczas można zmniejszyć 
liczbę cykli maszynowych w cyklu instrukcyjnym, a tym samym przyspieszyć działania 
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procesora. Projektując komputer stajemy przed problemem kompromisu pomiędzy kosztem 
sprzętu a czasem wykonywania programu. 


Podany opis działania procesora nie ujmuje jednak wielu problemów związanych 
z działaniem procesora. Na przykład ze schematu z rysunku 2.2 nie wynika jak zwiększyć 
zawartość licznika rozkazów lub jak załadować do niego nową wartość? Jak dekoder 
instrukcji wymusza odpowiednie wysterowania procesorem? Jak połączyć procesor z pa- 
mięcią? itd. Zagadnienia te opisano bardziej szczegółowo w rozdziale 4, ale dla ich 
zrozumienia trzeba poznać elementy z jakich składa się komputer oraz kody jakimi się on 
posługuje. Problemy te przedstawiono w rozdziale 3 w zakresie potrzebnym dla podanego 
celu. 


PODSTAWY 
TECHNIKI CYFROWEJ 


3.1. UKŁADY CYFROWE 


3.1.1. WPROWADZENIE 


Poszczególne bloki komputerów są budowane z układów cyfrowych zwanych także ukła- 
dami logicznymi. Pod tą nazwą kryją się zarówno proste układy małej skali integracji, tj. 
bramki i przerzutniki (układy SSI), jak i bardziej złożone układy średniej skali integracji, 
np. sumatory czy rejestry (układy MSI), a także te najbardziej złożone układy wielkiej 
skali integracji lub bardzo wielkiej skali integracji, jak procesory czy pamięci (układy LSI 
i VLSI). Każdy układ cyfrowy można przedstawić jako „czarną skrzynkę” (blok) z określo- 
ną liczbą wejść i wyjść. Sygnały wejściowe i wyjściowe są sygnałami binarnymi, tj. przyj- 
mują jedną z dwu wartości: zero lub jeden. Formalny opis zależności pomiędzy wejścio- 
wymi i wyjściowymi sygnałami binarnymi umożliwia algebra Boole'a, która w zakresie 
wystarczającym dla potrzeb tej książki, jest przedstawiona w Dodatku A. Czytelnik zainte- 
resowany bardziej szczegółowymi informacjami na ten temat musi sięgnąć do innych 
pozycji bogatej literatury obejmującej ten temat. 


Uporządkowany ciąg wartości wszystkich sygnałów wejściowych danego bloku nazy- 
wamy słowem wejściowym, a uporządkowany ciąg wartości wszystkich sygnałów wyjścio- 
wych — słowem wyjściowym. Działanie takiego układu opisuje się zależnością pomiędzy 
zbiorem słów wejściowych i zbiorem słów wyjściowych. Jeżeli danemu słowu wejściowe- 
mu odpowiada zawsze tylko jedno słowo wyjściowe, to blok taki daje się opisać funkcją 
boolowską i mówi się, że jest to układ kombinacyjny. Układy kombinacyjne opisano 
w podrozdziale 3.1.2. Jeżeli zaś istnieje co najmniej jedno słowo wejściowe, na które dany 
blok odpowiada różnymi słowami wyjściowymi w różnych chwilach czasu, to układ taki 
jest nazywany układem sekwencyjnym. Dla takich układów słowo wyjściowe zależy nie 
tylko od słowa wejściowego, ale i od stanu w jakim blok się znajduje w danym momencie 
i dlatego opis takich bloków jest bardziej złożony. Układy sekwencyjne przedstawiono 
w podrozdziale 3.1.3. 


3.1.2. UKŁADY KOMBINACYJNE 


W technice cyfrowej układy kombinacyjne realizuje się stosując bądź odpowiedni zestaw 
bramek, bądź standardowe bloki kombinacyjne jak dekodery lub multipleksery, bądź 
przedstawione dalej układy matrycowe. Rozpatrzmy teraz to pierwsze rozwiązanie, tj. ukła- 
dy kombinacyjne zbudowane za pomocą bramek. Bramka (ang. gate) jest to podstawowy 
układ logiczny, który realizuje prostą funkcję boolowską, na przykład sumę lub iloczyn 
logiczny. Istnieją bramki dwu- i więcej wejściowe. Bramki elektroniczne realizuje się 
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w różnych technologiach, tzn. stosując różne rozwiązania układu elektronicznego. Obecnie 
jedną z najpowszechniej stosowanych jest technologia CMOS, która charakteryzuje się 
bardzo małą mocą pobieraną ze źródła zasilania i dużą szybkością działania. 


ag> 106 0 e 


NOR NAND iloczyn 
J> AES? * >| ?= 
suma suma mod 2 NOT 


Rysunek 3.1. Oznaczenia podstawowych bramek 


Na rysunku 3.1 pokazano oznaczenia graficzne sześciu bramek najczęściej stosowa- 
nych w technice cyfrowej. Przedstawiono trzywejściowe bramki sumy (na wyjściu bramki 
jest 0 wtedy i tylko wtedy, gdy na wszystkich wejściach są 0) i iloczynu (na wyjściu jest 1 
wtedy i tylko wtedy, gdy na wszystkich wejściach są 1), czterowejściowe bramki NOR (na 
wyjściu jest 1 wtedy i tylko wtedy, gdy na wszystkich wejściach są 0) i NAND (na wyjściu 
jest 0 wtedy i tylko wtedy, gdy na wszystkich wejściach są 1), dwuwejściową bramkę 
sumy modulo 2 lub inaczej EXOR (na wyjściu jest 1, gdy sygnały wejściowe mają różne 
wartości) i jednowejściową bramkę inwertera NOT (na wyjściu jest przeciwna wartość niż 
na wejściu). Nazwy niektórych bramek pochodzą od angielskich skrótów: 

— NOR — not or (nie lub) czyli negacja sumy logicznej, 

— NAND — not and (nie i) czyli negacja iloczynu logicznego, 

— EXOR — exclusive or (suma wyłączająca). 


Celem uproszczenia niektórych rozwiązań, często stosuje się bramki specjalne, które 
można połączyć w sposób prostszy niż to wynika z działania logicznego bramki. Na 
rysunku 3.2a pokazano połączenie dwóch bramek iloczynów logicznych, które jest nie- 
dozwolone, gdy wykorzystuje się bramki standardowe. Ale połączenie takie może mieć 
miejsce, jeżeli są to tzw. bramki typu OC, tj. bramki z otwartym kolektorem (ang. open 
collector). Połączenie wyjść obu bramek z rezystorem realizuje funkcję sumy logicznej, 
tzw. sumy na drucie (ang. wire-or). Na rysunku 3.2b pokazano równoważny układ standar- 
dowy. Innym rodzajem bramek specjalnych są tzw. bramki trójstanowe (ang. three-state). 
Można je stosować w podobny sposób jak bramki typu OC, ale ich dodatkową zaletą jest 
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Rysunek 3.2. Bramki typu OC 
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możliwość separacji pomiędzy wyjściem bramki i jej obciążeniem. Oznacza to, że na 
wyjściu tych bramek, obok stanu zera logicznego lub stanu jedynki logicznej, może 
pojawić się tzw. stan trzeci, tj. stan, w którym wyjście bramki przedstawia sobą wysoką 
impedancję (ang. high impedance). Wówczas wyjście bramki jest elektrycznie odseparo- 
wane od obciążenia. Praktycznie oznacza to odłączenie bramki od pozostałej części układu. 
Wykorzystanie bramek do projektowania układów kombinacyjnych pokazane zostanie na 
przykładzie. 


Rozpatrzmy teraz proces projektowania na przykładzie jednobitowego sumatora. 
Niech będą dane dwie liczby A i B przedstawione w naturalnym kodzie binarnym — NKB 
(por. podrozdz. 3.2): A= È a, 2' oraz B= È b, 2'. 

1 1 


Jak znaleźć ich sumę arytmetyczną? Podobnie jak w przypadku dodawania wielo- 
pozycyjnych liczb dziesiętnych na papierze, tak i w tym przypadku dodaje się do siebie 
poszczególne pozycje poczynając od najmniej znaczących i uwzględniając ewentualne 
przeniesienie z mniej znaczącej pozycji. Zatem operacja jednopozycyjnego dodawania 
(dodawania dwóch bitów wraz z przeniesieniem) polega na wyliczeniu wartości dwóch 
funkcji. Pierwsza z nich jest to funkcja y, będąca binarnym wynikiem dodawania i druga 
funkcja c,,,, będąca wartością przeniesienia na następną pozycję. Obie te funkcje są 
funkcjami trzech zmiennych: wartości danej pozycji pierwszej liczby a., wartości danej 
pozycji drugiej liczby b, i wartości przeniesienia z poprzedniej pozycji c.. 


Tablica 3.1. Tabela prawdy definiująca działanie sumatora 


a bi c yi Ci+1 
0 0 0 0 0 
1 0 0 | 0 
0 1 0 l 0 
1 1 0 0 1 
0 0 1 l 0 
1 0 1 0 || 
0 1 l 0 l 
1 1 || l l 


Działanie sumatora zilustrowano w tablicy 3.1, która jest tabelą prawdy (por. Doda- 
tek A) dla funkcji wyniku i funkcji przeniesienia. 


Na rysunku 3.3 przedstawiono mapy Karnaugha (por. Dodatek A) dla obu wymienio- 
nych funkcji. Dalej podano tzw. postać alternatywną funkcji y, (postać sumy iloczynów 
więc znak + oznacza tutaj sumę logiczną) 


y= a,b,c, + a.b.c.+ a.b.c. + a.b.c. 


1 1 1 11 1 i 1 1 
którą można zrealizować za pomocą układu składającego się z 8 bramek: czterowejściowej 
bramki sumy logicznej, czterech trzywejściowych bramek iloczynów logicznych i trzech 
inwerterów. Natomiast można zauważyć, że funkcję tę można przedstawić także w postaci: 


yi rajdób; Oy 
Do realizacji takiej postaci funkcji logicznej trzeba jedynie dwóch bramek EXOR. 
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ai b; 


Rysunek 3.3. Mapy Karnaugha jednopozycyjnego sumatora 


Rozpatrzmy teraz funkcję przeniesienia. Można zauważyć, że funkcję tę można zapi- 
sać jako: 


ci+1 7 aib; + ajcj + bjcj. 
Do realizacji tej postaci potrzeba jednej trzywejściowej bramki sumy 1 trzech dwu- 


wejściowych bramek iloczynu. Układ sumatora jednobitowego realizujący funkcje y. i c., 
pokazano na rysunku 3.4. 


aj 


A |D— v 


Ci+1 


Rysunek 3.4. Sumator jednobitowy 


Aby zrealizować operację sumowania dwóch k-bitowych liczb można połączyć ze 
sobą k jednopozycyjnych sumatorów jak pokazano na rysunku 3.5. Połączenie musi 
zapewnić właściwy kierunek propagacji przeniesienia. W przypadku sumatora przeniesie- 
nie musi propagować od najmniej znaczącej pozycji do najbardziej znaczącej. 


Układ kombinacyjny składający się z k identycznych bloków jest nazywany układem 
iteracyjnym. Projektując taki układ należy pamiętać o właściwym kierunku propagacji 


Dk-1 Ak-1 


Rysunek 3.5. Iteracyjny układ sumatora wielobitowego 
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przeniesienia. Zaletą takiego układu jest to, że może być w razie potrzeby rozbudowywany 
oraz, że jego przejrzysta struktura ułatwia testowanie. Wadą takiego układu jest to, że 
przeniesienie propaguje się przez wszystkie bloki, co powoduje zmniejszenie szybkości 
działania układu. Układy iteracyjne stosowane są wtedy, gdy efektywnie da się wykorzy- 
stać ich zalety. Ma to miejsce na przykład w przypadku, gdy pożądana jest rozbudowy- 
walność układu. Ale w przypadku sumatorów szybkość działania jest bardzo istotnym 
czynnikiem i dlatego poszukuje się takich struktur sumatorów, które pozwolą na zwięk- 
szenie szybkości działania. Często są to sumatory iteracyjne wraz z układami przy- 
spieszającymi, które zostaną przedstawione dalej. 


SUMATORY 


We współczesnych komputerach sumatory są projektowane jako część wielkoscalonego 
układu zawierającego np. cały procesor. Natomiast tutaj, dla zrozumienia zasady ich 
działania, przedstawiono je jako układy scalone średniej skali integracji MSI. Sumatory 
MSI bywały produkowane jako układy 4-bitowe. Projektanci układów scalonych zapewnia- 
li możliwość łączenia ze sobą układów MSI tak, aby można było złożyć z nich sumatory 
o większej długości słowa, np. 16-bitowe. Celem przyspieszenia pracy takich sumatorów 
projektanci wyznaczali przeniesienie wyjściowe z najbardziej znaczącej pozycji każdego 
sumatora 4-bitowego. Przeniesienie to można wyznaczyć na podstawie znajomości wartoś- 
ci wszystkich 8 bitów obu słów wejściowych oraz bitu przeniesienia wejściowego. W tym 
celu, dla sumatora 4-bitowego, należy wyznaczyć funkcję boolowską 9 zmiennych. 


aobo a1b1 a2b2 a3b3 
| | | 


Co 


Y ch 


Rysunek 3.6. Czterobitowy sumator z przeniesieniem wspólnym 


Y Y 
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Niech 4-bitowy sumator ma wejścia ap bg ap bi a, bo, a,, b, oraz przeniesienie 
wejściowe c). Niech g. oznacza iloczyn zmiennych a, i b, a p, sumę mod 2 tych samych 
zmiennych. Z poprzednich rozważań można zauważyć, że funkcje przeniesień z posz- 
czególnych stopni sumatora można przedstawić w następujących postaciach: 


= 8, + Pi = 84 + Pigo + PiPoCo 
3 7 B t P202 = 83 + P28, + P P180 + P2P1PoCo 
47 83 + P303 = 83 + P383 + P3D>8, + P3P3P180 + PPP, Gy 


Rysunek 3.7. Sumator 16-bitowy 


Biorąc za podstawę te równania można zrealizować sumator 4-bitowy tak jak pokazano 
na rysunku 3.6. Układ ten nie jest układem iteracyjnym. Wyznaczono tylko jedno prze- 
niesienie wyjściowe c, dla wszystkich 4 bitów. Przyspiesza to pracę takiego sumatora 
w stosunku do układu iteracyjnego, gdyż przeniesienie generowane jest krótszą drogą. 
Łącząc ze sobą cztery takie 4-bitowe sumatory (rys. 3.7) można zbudować sumator 16-bito- 
wy, w którym przeniesienie propagowane jest przez cztery stopnie iteracji, a nie przez 
szesnaście jak byłoby w przypadku klasycznego układu iteracyjnego. 


KOMPARATORY 


Komparatorem nazywa się układ logiczny wskazujący fakt równości lub nierówności 
dwóch binarnych słów wejściowych tego układu. W przypadku nierówności słów kompa- 
rator może też wskazywać, które ze słów wejściowych jest większe. Jednobitowym kom- 
paratorem wskazującym jedynie fakt równości bitów jest po prostu dwuwejściowa bramka 
sumy modulo 2. Jeśli na jej wejściach są takie same wartości bitów, to na wyjściu jest 0. 
Jeśli natomiast bity wejściowe mają przeciwne wartości, to na wyjściu jest 1. 


Na rysunku 3.8 pokazano schemat jednobitowego komparatora wskazującego zarówno 
fakt równości bitów, jak i określającego który z nich ma większą wartość. 


w» 


Rysunek 3.8. Komparator jednobitowy 
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a A1 
Ao A>B 
B1 
Bo A=B 
b 
A>B 
Ao B 
o o o Ol o 1 
0.0 0 1| 0 0 
o o 1 Ol o 0 
0.0 1 1| 0 O 
0.4 o Ol 1 O 
0.1 o 1| o 1 
0.1 1 O| 0 O 
Oo 1 1 1] o0 0 
1 0 0 Ol 1 0 
1 0 O 1| 1 0 c 
1.0 1 Ol o 1 
1 0 1 1| 0 0 A 2 
1 1 0 Ol| 1 0 A>B 
1 1 O 1| 1 0 A=B 
1 1 1 O| 1 0 B 2 
1 1 1 110 O Sax 


Rysunek 3.9. Komparator dwubitowy 


wejścia ze stopnia 
poprzedniego 
A>B A=B A<B 


wejścia 
A1 Bı 


wyjścia 
A>B A=B A<B 


Aą B2 


A3>B3 X X X X X X 1 O O 
A3<B3 X X X X X X O O 1 
A3=B3 A2>B2 X X X X X 1 O O 
A3=B3 A2<B2 X X X X X O 0 1 
A3=B3 A2=B2 A1>B1 X X X X 1 O O 
A3=B3 A2=B2 A4<B1 X X X X (0) O 1 
A3=B3 A2=B2 A1=B1 Ao>Bo X X X 1 O O 
A3=B3 A2=B2 A1=B1 Ag<Bo X X X 0 O 1 
A3=B3 A2=B2 A1=B4 Ag=Bo 1 0 O 1 O O 
A3=B3 A2=B2 A1=B4 Ag=Bo 0 O 1 O O 1 
A3=B3 A2=B2 A1=B1 Ao=Bo (0) 1 O O 1 0 
A3=B3 A2=B2 A1=B1 Ao=Bọo 1 O 1 O 0 0 
A3=B3 A2=B2 A1=B4 Ag=Bo O 0 O 1 O 1 
b 4A : 
A>B A>B 
=B A=B 
A>B F A>B 
B 


Rysunek 3.10. Komparator czterobitowy 
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Najmniej Najbardziej 
znacząca znacząca 
4 tetrada 4 4 tetrada 


1 yo 
1 a ||| M] a 
EEZEEEWEE-i 
1 a naa 
4 4 4 


Rysunek 3.11. Iteracyjny układ komparatora wielobitowego 


Natomiast na rysunku 3.9a pokazano schemat dwubitowego komparatora. Jak widać 
z rysunku jest to układ o wiele bardziej złożony. Często układ taki przedstawia się na 
schematach w sposób przedstawiony na rysunku 3.9c. Na rysunku 3.9b pokazano tabelę 
prawdy opisującą działanie takiego układu. 


Tabelę objaśniającą działanie 4-bitowego komparatora pokazano na rysunku 3.10a. 
Pierwsze dwa wiersze tabeli pokazują przypadki, gdy najbardziej znaczące bity są nie- 
równe. Wtedy, bez względu na wartości pozostałych bitów i wartości wejść z poprzedniego 

stopnia, na wyjściach pojawiają się pokazane w tabeli wartości. Podobnie interpretowane 
są następne wiersze tabeli od 3 do 8. W pozostałych 5 wierszach pokazano przypadki, gdy 
bity wejściowe są równe, ale na wejściach z poprzedniego stopnia pojawiają się wartości 
świadczące o nierówności słów tamtego stopnia. Na rysunku 3.10b przedstawiono schema- 
tyczne oznaczenie takiego komparatora. Natomiast na rysunku 3.11 pokazano iteracyjny 
układ komparacji. Prawidłowy kierunek iteracji jest od mniej znaczących bitów do bardziej 
znaczących (na rysunku od lewej do prawej) i decydującym o wyniku komparacji jest 
komparator najbardziej znaczących bitów. 


ORO ORO 


A>B 
A=B 
A<B 


i 


Rysunek 3.12. Kaskadowy układ komparatora 16-bitowego 


Istnieje także inny sposób łączenia komparatorów pokazany na rysunku 3.12. Taki 
układ komparacji może pracować szybciej niż układ iteracyjny, gdyż przeniesienie nie 
' propaguje się przez wszystkie stopnie. Natomiast wadą tego układu jest ograniczenie 
długości porównywanych słów do 16 bitów. 
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DEKODERY 


Dekoderami nazywane są układy o n wejściach i 2” wyjściach. Przekształcają one słowo 
wejściowe w kodzie NKB na słowo w kodzie „1 z 2™ (por. podrozdz. 3.2). Oznacza to, że 
każdej kombinacji bitów wejściowych jest przypisana jedna pozycja słowa wyjściowego. 
Jeżeli dana kombinacja bitów pojawi się na wejściu, to na odpowiedniej pozycji słowa 
wyjściowego (na danym wyjściu) pojawi się 1, a wszystkie inne pozycje przyjmą wartość 
0. Istnieją dekodery, które wyróżniają daną kombinację przyjmując na odpowiednim 
wyjściu wartość 0, podczas gdy na pozostałych wyjściach są 1. 


a b 

E x 
B 100 0|1 0000000 
-i 1 1 00l0 1000000 
SERIE 10 10|0 O 100000 
== 11 1 0|0 00 1 0000 0 
BEGE 100 1|0 0 0 0 1 000 
Ti 110 1]|0 0000100 
— 10 1 10 000 0 0 10 
Ra 11 1 1|0 0000001 
E 0x x x100 0 0.0000 0 

c 
3 8 
E 


Rysunek 3.13. Dekoder trzywejściowy 


Na rysunku 3.13a pokazano układ trzywejściowego, a zatem 8-wyjściowego, dekodera. 
Na rysunku 3.13b przedstawiono tabelę prawdy dla tego układu, a na rysunku 3.13c jego 
oznaczenie. Jak widać z tego rysunku układ jest wyposażony w dodatkowe wejście E 
(ang. enable) nazywane wejściem dostępu, albo wejściem zezwalającym, albo wejściem 
uaktywniającym. Jeśli E = 0, to działanie układu zostaje zablokowane. Mówimy, że układ 
jest dezaktywowany. W takim przypadku na wyjściu dekodera pojawiają się same 0, 
a więc słowo wyjściowe nie jest z kodu „l z 2™”. Dekodery wykorzystywane są często 
jako układy wybierające. Stosowane są na przykład jako układy wybierania komórek 
z pamięci na podstawie podanego adresu. Podobnie jak dla sumatorów i komparatorów, 


tak i w tym przypadku istnieje konieczność łączenia dekoderów ze sobą ze względu na 
potrzeby zwiększenia liczby wejść. 


Na rysunku 3.14 pokazano jak z dwóch dekoderów 3-wejściowych można zbudować 
jeden dekoder 4-wejściowy (16-wyjściowy). Należy zwrócić uwagę na wykorzystanie do 
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wejście 
dodatkowe 


Rysunek 3.14. Połączenie dwóch dekoderów trzywejściowych 


tego celu wejścia E. Jeżeli na „dodatkowe wejście podano 1, to aktywny będzie dekoder 
górny, a dolny będzie nieaktywny. Jeżeli natomiast na to wejście podano 0, to aktywny 
będzie dekoder dolny, a górny będzie nieaktywny. Zatem oba dekodery pracują na- 
przemiennie w zależności od stanu na „wejściu dodatkowym . 


Strukturę taką można rozbudowywać. Na rysunku 3.15 pokazano strukturę dekodera 
o 6 wejściach i 64 wyjściach zbudowanego z 9 dekoderów 3-wejściowych. Jest to struktura 
dwustopniowa. W pierwszym stopniu pracuje dekoder sterujący wejściami E dekoderów 
stopnia drugiego. W drugim stopniu pracuje 8 dekoderów, przy czym tylko jeden z nich 
może być aktywny w danej chwili. Istnieje możliwość dalszego składania takich układów. 
Postępując analogicznie (jak na rys. 3.15) można złożyć dekoder 12-wejściowy (4196- 
-wyjściowy). Do tego celu trzeba użyć 65 dekoderów 6-wejściowych pokazanych na 
rysunku 3.15. 


E 


Rysunek 3.15. Dwustopniowy dekoder 6-wejściowy 
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w1 Becer 


w2 ---- 


Wm NONE 


ką k2 km 


Rysunek 3.16. Dekoder matrycowy 


Układ taki jednak ma tę wadę, że wzrasta liczba jego stopni, a razem z nią czas 
propagacji sygnału od wejścia do wyjścia. Powoduje to zmniejszanie szybkości dekodo- 
wania. Projektowanie dekoderów o dużej liczbie wyjść stawia projektantów przed wy- 
borem pomiędzy złożonością dekodera a szybkością jego działania. Dekodery o dużej 
liczbie wyjść są trudne do realizacji, choćby ze względu na ograniczenie liczby końcówek 
układu scalonego. Dlatego w układach LSI dekodery są scalane wraz z układem, którym 
sterują. W takim przypadku łatwiej dokonać połączeń. Przedstawione układy są dekode- 
rami zwanymi dekoderami liniowymi. Problem dekodowania dużej liczby sygnałów wejś- 
ciowych jest często rozwiązywany także za pomocą tzw. dekodowania matrycowego. 


Niech będzie dana matryca 2” dwuwejściowych bramek iloczynów jak na rysun- 
ku 3.16a. Jeżeli n jest parzyste, to matryca jest kwadratowa, natomiast jeżeli n jest nie- 
parzyste, to matryca jest prostokątna. Jak widać z rysunku jedne wejścia bramek (znaj- 
dujących się w tym samym wierszu) są ze sobą połączone i stanowią tzw. wejścia wierszy 
dekodera w.. Pozostałe wejścia bramek (znajdujących się w tej samej kolumnie) także są 
ze sobą połączone i stanowią wejścia kolumn k.. Dla parzystego n mamy m= 2 wierszy 
i tyle samo kolumn. Układ pokazany na rysunku 3.16b jest dwustopniowym dekoderem 
n-wejściowym, tj. 2-wyjściowym. Pierwszy stopień dekodera stanowią dwa klasyczne 
dekodery o 27? wyjściach każdy, a drugi stopień stanowi matryca 2" bramek AND. 


W tablicy 3.2 porównano liczby bramek potrzebne do realizacji dekodera jednostop- 
niowego i dekodera matrycowego, przy czym obok liczby bramek podano w nawiasach 
wymaganą liczbę wejść tych bramek. Cena dekoderów matrycowych jest niższa, gdyż 
mimo większej liczby bramek mają one znacznie mniejszą liczbę wejść. Dekodery takie 
są najczęściej stosowane w pamięciach, gdzie potrzebna jest duża liczba wyjść dekodera, 


Tablica 3.2. Porównanie dekoderów 


n Dekoder Dekoder 
jednostopniowy matrycowy 
8 256(8) 32(4)+ 256(2) 
10 1024(10) 64(5) + 1024(2) 


12 4096(12) 128(6) + 4096(2) 
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sięgająca wielu milionów. Pamięć o pojemności miliona komórek (27) wymaga zastosowa- 
nia bądź jednostopniowego dekodera składającego się z ponad miliona (27) bramek 20- 
-wejściowych, bądź dekodera matrycowego z matrycą 27 dwuwejściowych bramek 
i dwóch 10-wejściowych dekoderów sterujących. W rozdziale 5 podano także inne sposoby 
budowania dekoderów pamięci. 


KODERY I KONWERTERY KODU 


Koderem (lub enkoderem) nazywany jest układ kombinacyjny, który zamienia kod 
wejściowy na kod binarny NKB. Na rysunku 3.17 pokazano prosty trzybitowy koder kodu 
„lz2”” (a) i odpowiadającą mu tabelę prawdy (b). Można zauważyć, że słowo wyjściowe 
kodera wskazuje binarnie numer wejścia, na którym jest 1. 


a b 

XT SE == 

“H za La 28 "AŻ Xo X1 X2 X3 X4 X5 X6 X7 

e | 10000000]|000 

X4 01000000]|001 
00100000]010 

sw 00010000]011 

x2 00001000]|l100 

X1 00000100]/101 
00000010]|110 

0 = 000000011111 


Rysunek 3.17. Koder trzybitowy 


W technice komputerowej stosowane są także kodery nazywane koderami 
priorytetowymi, gdyż na ich wyjściach pojawia się słowo w kodzie NKB, które wskazuje 
na taki numer wejścia, który spełnia dwa warunki: pierwszy, że jest na nim 1, a drugi, że 
jest to wejście najbardziej znaczące spośród tych, na których jest 1. Na rysunku 3.18 
pokazano tabelę prawdy 1 oznaczenie takiego kodera. Jest to koder 8-wejściowy 
wyposażony w wejście dostępu E. Koder ten ma 5 wyjść. Trzy z nich są wyjściami 
informacyjnymi, a dodatkowe wyjścia EO (ang. enable output) i GS (ang. group strobe) 
wskazują na pewne wybrane kombinacje słowa wejściowego. I tak wyjście EO jest aktyw- 
ne, gdy na wejściach informacyjnych jest jakakolwiek jedynka. 


E Xo X1 X2 X3 X4 Xs Xe X7 | Y2 Y1 Yo GS EO 
O xxxxxxxx|OOOĐO 1 1 
1 00000000000 1 0 
LX 06 XX X X LdA 11 O 1 
1 XXXxXxXxxx10]/011 O 1 
1 XXXxXXXxX100]/101 O 1 
1 X XXxXX1000/001 O 1 
1 Xxx 1LOOOOJ110 O 1 
1 XX 1LOOOO0O0O]010O O 1 
1 x 1000000]/100 O 1 
1 10000000I01000 O 1 


Rysunek 3.18. Tabcla prawdy i oznaczenie kodera priorytetowego 


3 — Podstawy budowy i działania komputerów 
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Natomiast sygnał na wyjściu GS wskazuje na dwa przypadki. Pierwszy (GS=1) wska- 
zuje, że stany wejść informacyjnych są zerami lub na wejściu E jest 0 i drugi (GS=0), że 
na co najmniej jednym wejściu jest 1. 


bn bn-1 bı 


t 


En En-1 g1 


Rysunek 3.19. Konwerter kodu NKB na kod Graya 


Przykładem innego konwertera kodu może być konwerter kodu NKB na kod Graya 
(i odwrotnie konwerter kodu Graya na kod NKB) oraz konwerter kodu binarnego na 
tzw. kod siedmiosegmentowy (por. rozdz. 5). W Dodatku pokazano, że kod Graya można 
utworzyć z kodu NKB biorąc g, = b, © b,,,. Na rysunku 3.19 pokazano układ iteracyjny 
pracujący według tej zależności. 


bn bn-1 b1 


Rysunek 3.20. Konwerter kodu Graya na kod NKB 


Podobnie zależność określająca kod NKB na podstawie kodu Graya pozwala na 
zbudowanie układu iteracyjnego jak na rysunku 3.20. 


Innym często stosowanym konwerterem kodu jest konwerter stosowany do wyświet- 
lania cyfr dziesiętnych. W takim przypadku kodem wejściowym jest 4-bitowy kod NKB 
a kodem wyjściowym kod siedmiosegmentowy (nazwa ta pochodzi od często przyjętego 
sposobu wyświetlania cyfr). Kod siedmiosegmentowy to kod służący do wysterowania 
siedmiu świecących „kresek ułożonych jak na rysunku 3.21a. W zależności od stanu na 


Rysunek 3.21. Zasada wyświetlania siedmioscgmentowego 
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LT BI/RBO 


Rysunek 3.22. Konwerter kodu BCD na kod siecdmiosegmentowy 


wejściach konwertera kodu, trzeba tak wysterować siedem segmentów wyświetlających, 
aby wyświetlić jedną z kombinacji pokazanych na rys. 3.21b. Taki zespół segmentów 
świecących pozwala na wyświetlenie wszystkich cyfr, a nawet pewnych dodatkowych 
znaków (znaków kodu szesnastkowego lub inaczej heksadecymalnego). 


Z rysunku 3.21 można wyznaczyć tabelę prawdy konwertera kodu siedmiosegmento- 
wego (zadanie to pozostawia się czytelnikom). Oznaczenia wejść i wyjść takiego kon- 
wertera pokazano na rysunku 3.22. Jak widać dodano tam pewne dodatkowe wejścia 
i wyjścia sterujące. I tak wejście LT (ang. lamp test) działa w taki sposób, że jeśli na nim 
pojawi się 1, to zapalają się wszystkie segmenty. Jest to test sprawności segmentów. 
Wejście RBI (ang. ripple-blanking input) służy do tego, aby istniała możliwość wygaszenia 
najbardziej znaczących zer. Linia wyjściowa BI/RBO (ang. blanking input/ripple blanking 
output) służy bądź jako wejście, bądź jako wyjście. Wykorzystywana jako wejście powo- 
duje zgaszenie wszystkich świecących się segmentów. Możliwość ta służy oszczędności 
pobieranej mocy, gdyż periodyczne wygaszanie wszystkich segmentów zmniejsza średni 
pobierany prąd. Gdy częstotliwość wygaszania jest większa od 40 Hz, to zjawisko wygasza- 
nia jest dla oka ludzkiego niezauważalne. Linia BI/RBO pracująca jako końcówka wyjścio- 
wa służy do współpracy z wejściem RBI sąsiedniego segmentu, aby jako przeniesienie na 
mniej znaczące pozycje (najbardziej znacząca pozycja jest zawsze przyłączona do 1) 
współdecydować o wygaszaniu lub nie wygaszaniu sąsiedniego segmentu. 


MULTIPLEKSERY I DEMULTIPLEKSERY 


Układy multiplekserów i demultiplekserów są układami realizującymi funkcję wybierania 
(selekcji). Zadaniem multipleksera jest dokonanie wyboru jednego z wielu wejść i skiero- 


a b c 
X1 
| Y 
X3 X4 8 
X4 X2 8 
Y 
X3 8 
X4 
E SG S E S1S2 S 


Rysunek 3.23. Multipleksery 


28 3. Podstawy techniki cyfrowej 


| Yı 
| Y2 Yo 8 j 
Y 
Y3 X t 
Y2 8 
Y3 
| | | | | 
E SG SS E S4S2 S 


Rysunek 3.24. Demultipleksery 


wania informacji z tego wejścia na wyjście. Demiltiplekser zaś wybiera jedno z wielu 
wyjść, na które skierowuje informację z wejścia. Na rysunku 3.23a pokazano układ 
4-wejściowego multipleksera (4 x 1), a na rysunku 3.23b jego oznaczenie. 


Na rysunku 3.24a pokazano strukturę 4-wyjściowego demultipleksera (1 x 4), a na 
rysunku 3.24b jego oznaczenie. W obu układach można wyróżnić wejścia informacyjne 
iwejścia sterujące. Stan binarny na wejściach sterujących stanowi kryterium wyboru. 
Wejście E jest wejściem zezwalającym na dostęp. W obu przypadkach funkcję wyboru 
realizuje się za pomocą dekodera, który w podanych przykładach jest dekoderem 2- 
-wejściowym z dodatkowym wejściem dostępu. 


Przedstawione na rysunkach 3.23a i 3.24a układy są układami jednobitowymi, 
tj. wejścia informacyjne w multiplekserach, jak i wyjścia informacyjne w demultiplekse- 
rach są jednobitowe. W technice komputerowej stosuje się często układy wielobitowe. 
W takim przypadku dokonywana jest selekcja całej grupy linii. Na rysunkach 3.23c 1 3.24c 
pokazano schematycznie układy, w których wybierana jest jedna z dwóch grup 8 linii. Dla 
takiej selekcji wystarczy tylko jedno wejście sterujące. Multipleksery takie stosuje się do 
wprowadzania informacji z dwóch różnych źródeł w jedno określone miejsce przeznacze- 
nia, a demultipleksery do wyprowadzania informacji z danego źródła w dwa różne miejsca 
przeznaczenia. 


KOMBINACYJNE UKŁADY MATRYCOWE 


W nowoczesnych systemach cyfrowych wykorzystuje się do projektowania złożonych 
układów kombinacyjnych układy wielkoscalone. Układy takie nazywane są układami 
matrycowymi, gdyż najczęściej stanowią one regularną strukturę elementów ułożoną w ma- 
trycę o pewnej liczbie wierszy i kolumn. Przykładowymi przedstawicielami takich układów 
są programowane matryce logiczne PLA (ang. programmable logic array), układy PLD 
(ang. programmable logic devices), tj. PLA wraz z przerzutnikami lub układy FPGA 
(ang. field-progrummable gate array), w których komórką matrycy są bardziej złożone 
układy logiczne niż w przypadku PLA. Dla zorientowania Czytelnika w tym zagadnieniu 
omówiono matrycę PLA. 


Na rysunku 3.25 pokazano przykładową prostą strukturę PLA. Struktura ta składa się 
z dwu matryc. Załóżmy, że pionowe linie matryc tworzą iloczyn „na drucie , a poziome 
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Rysunek 3.25. Matryca PLA dla 6 funkcji 4 zmiennych 


sumę „na drucie . Załóżmy ponadto, że potrafimy programować takie matryce, tj. doko- 
nywać połączenia w dowolnym miejscu skrzyżowań lub też zostawiać te miejsca bez 
połączenia. Kropkami oznaczono połączenia w matrycach, które na rysunku 3.25 realizują 
dwie funkcje logiczne y, i y: 


Yı = X1X2X3 tX iX2X3 
Y2 = X1X2X3 tX X2X3 


W podanym przykładzie użyto tylko 3 zmiennych, choć w przykładowej matrycy 
można projektować funkcje 4 zmiennych. Górna matryca realizuje funkcję iloczynu. 
istnieje 16 możliwych iloczynów 4 zmiennych, jednak zakłada się zwykle mniejszą liczbę 
kolumn w górnej matrycy, aby uzyskać duże wykorzystanie powierzchni przy danych 
rozmiarach matrycy. Dolna matryca jest matrycą realizującą funkcję sumy. Jej rozmiary, 
w naszym przykładzie, pozwalają na realizację 6 różnych funkcji. W przykładzie wy- 
korzystano jedynie dwa wiersze dla realizacji dwóch funkcji. 


Pokazany układ PLA jest nazywany matrycą AND-OR, ze względu na funkcje 
realizowane przez matryce (górną i dolną). Stosowane są także matryce OR-AND, NAND- 
-NAND i NOR-NOR. Celem umożliwienia projektowania układów sekwencyjnych 
(por. podrozdz. 3.2) często do takich matryc dodawane są jeszcze przerzutniki. 


3.1.3. UKŁADY SEKWENCYJNE 


Jak wcześniej już powiedziano istnieją takie układy cyfrowe, które pobudzane takim 
samym słowem wejściowym w różnych momentach czasu dają różne odpowiedzi. Zależy 
to od „stanu układu, w jakim zastało go dane pobudzenie. Takie układy nazywane są 
układami sekwencyjnymi. Nazwa ta bierze się stąd, że dla danej sekwencji pobudzeń 
układ generuje odpowiednią sekwencję wyjściową. Mówimy, że układ sekwencyjny 
pamięta swoje stany. Projektuje się dwa rodzaje układów sekwencyjnych: synchroniczne 
i asynchroniczne. Układy synchroniczne zmieniają swój stan, i tym samym stan swoich 
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wyjść, tylko w określonych chwilach, zadawanych przez odpowiedni generator zwany 
zegarem. Mówimy, że ich działanie jest synchronizowane zegarem. Układy asynchroniczne 
zmieniają swój stan 1 stan swoich wyjść w czasie zmiany sygnałów wejściowych. Układy 
synchroniczne budowane są nie tylko z bramek logicznych, ale także z elementów pamięta- 
jących czyli tzw. przerzutników (por. Dodatek A). Układy asynchroniczne mogą być 
budowane z przerzutnikami albo bez przerzutników i wtedy rolę elementu pamiętającego 
spełnia tzw. sprzężenie zwrotne. W systemach komputerowych częściej stosowane są 
układy synchroniczne ze względu na większą pewność ich działania. Układy asynchro- 
niczne znalazły większe zastosowanie w układach automatyki. Często złożone układy 
sekwencyjne projektuje się nie tylko z bramek 1 przerzutników (por. Dodatek), ale także za 
pomocą pewnych standardowych układów sekwencyjnych. Najczęściej spotykane 
standardowe układy sekwencyjne to rejestry i liczniki. Dalej omówiono je w takiej właśnie 
kolejności. 


REJESTRY 


Najpowszechniej stosowanym standardowym układem sekwencyjnym jest rejestr. Jest to 
układ składający się z przerzutników, przy czym każdy z nich wykonuje podobne funkcje 
i każdy z nich jest podobnie wysterowany. Na przykład są one jednocześnie odczytywane 
lub zapisywane, jednocześnie ustawiane (termin ten oznaczać będzie wpisywanie wartości 
I do przerzutnika) lub zerowane. Na rysunku 3.26a pokazano rejestr składający się z czte- 
rech przerzutników. Jest on wyposażony w 4 wejścia informacyjne D, oraz 3 wejścia 
sterujące: wejście zegarowe ZEG (ang. CLK), wejście zerujące ZER (ang. CLR) i wejście 
ustawiające UST (ang. PRESET), tj. wpisujące do wszystkich przerzutników wartość 1. 


a Q1 Q2 Q3 Q4 
UST 
RZ 
scji A i E 
ZER 
D1 D2 D3 D4 
b D1 Q1 
D2 Q2 
R T 
Da EJESTR Q3 
D4 Q4 
ZEG 
ZER 
UST 


Rysunek 3.26. Czterobitowy rejestr ustawiany i zerowany 
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ZEG 


Rysunek 3.27. Rejestr przesuwający 


W takim rejestrze zapis nowej zawartości jest dokonywany poprzez wejścia D, synchro- 
nicznie z zegarem. Wynika to z działania zastosowanych przerzutników. Po podaniu na 
wejścia D, jakiegoś słowa i po przyjściu impulsu zegarowego słowo to zostanie zapamię- 
tane w tym rejestrze i pojawi się na jego wyjściach Q.. Natomiast pozostałe wejścia 
sterujące mogą zmieniać stan przerzutników w sposób synchroniczny z zegarem lub też 
asynchronicznie. Pokazany rejestr jest nazywany rejestrem równoległo-równoległym, gdyż 
zarówno odczyt, jak i zapis do niego odbywają się w sposób równoległy. 


Innym rodzajem rejestru może być rejestr, w których wejścia i wyjścia przerzutników 
są w pewien sposób połączone. Na rysunku 3.27a pokazano kaskadowy sposób połączenia, 
który tworzy układ nazywany rejestrem przesuwającym (ang. shift register). W pokaza- 
nym układzie jest jedno wejście informacyjne WE, jedno wejście z generatora zegara ZEG 
i cztery wyjścia Q.. Taki rejestr nazywa się rejestrem szeregowo-równoległym, gdyż wpro- 
wadzanie informacji do niego odbywa się w sposób szeregowy, a wyprowadzanie infor- 
macji z rejestru ma charakter równoległy. Istnieją także rejestry równoległo-szeregowe 
i szeregowo-szeregowe. 


Rozpatrzmy teraz jak działa rejestr przesuwający z rysunku 3.27a. Na rysunku 3.27b 
przedstawiono w tablicy 6 kolejnych stanów rejestru, dla 6 kolejnych impulsów zegaro- 
wych, przy założeniu, że pierwszy stan był 0000 i przy założeniu wejściowej sekwencji 
bitów równej 01000. Z rysunku wynika, że po czwartym impulsie zegarowym, od momentu 
gdy na wejściu rejestru pojawiła się 1, pojawi się ona na wyjściu ostatniego przerzutni- 
ka Q,- 


Przedstawimy teraz działanie kilku układów sekwencyjnych zbudowanych z użyciem 
rejestrów przesuwających. Na rysunku 3.28a pokazano jeden z możliwych sposobów po- 
łączenia wejścia WE i wyjścia Q 4 rejestru przesuwającego z rysunku 3.27. Przy założeniu, 
że pierwszym stanem przerzutników będzie stan 1000, układ będzie zmieniał swoje stany 
zgodnie z sekwencją pokazaną na rysunku 3.28b. Podczas ciągłego podawania sygnału 


a b c 
p 1000 1100 1110 1010 
| Rejestr przesuwający 0100 0110 0111 0101 
0010 0011 1011 1010 
ZEG 0001 1001 1101 
1000 1100 1110 


Rysunek 3.28. Licznik pierścieniowy 
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zegarowego sekwencja tych czterech stanów powtarza się. Taki jednowejściowy układ 
sekwencyjny (przykładowy układ sekwencyjny ma tylko wejście zegarowe) może pełnić 
rolę licznika (por. tekst dalej). W tym przypadku jest to licznik impulsów zegarowych. 
Każdy stan jest powtarzany po określonej liczbie impulsów wejściowych. Liczba ta nazy- 
wana jest okresem licznika. Rozważany układ jest nazywany czterobitowym (cztero- 
stanowym) licznikiem pierścieniowym. W tym przypadku liczba przerzutników jest równa 
okresowi licznika. Zauważmy, że inaczej przebiega sekwencja stanów, jeśli rozpocznie się 
ona od innego stanu. Na rysunku 3.28c pokazano trzy inne możliwe sekwencje licznika 
pierścieniowego. Przypadkowe wejście w stan 0000 lub 1111 powoduje, że układ pozostaje 
w tym stanie. 


a b c 
- 1000 1010 
Rejestr przesuwający 1100 1101 
1110 0110 
a a ME eT 1111 
0111 0101 
0011 0010 
0001 1001 
0000 0100 


Rysunek 3.29. Licznik liczący w kodzie Johnsona 


Rozpatrzmy działanie innego układu pokazanego na rysunku 3.29a i zbudowanego 
zużyciem 4-bitowego rejestru przesuwającego. Także i w tym przypadku załóżmy jako 
stan początkowy stan 1000. Sekwencja 8 stanów pokazana jest na rysunku 3.29b. Tym 
razem czteroprzerzutnikowy rejestr przesuwający jest licznikiem do ośmiu. Taki licznik 
jest nazywany licznikiem w kodzie Johnsona (por. podrozdz. 3.2). Gdyby założyć jako 
stan początkowy stan nie należący do kodu Johnsona, to otrzymamy inną sekwencję 
8 stanów pokazaną na rysunku 3.29c. 


Rejestr przesuwający 


OOORPREREREOROPRKROCH 
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Rysunek 3.30. Licznik łańcuchowy 
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Rozpatrzmy jeszcze układ pokazany na rysunku 3.30a. Nosi on nazwę licznika łańcu- 
chowego. W ogólnym przypadku długość sekwencji stanów takiego licznika może wynosić 
maksymalnie 2-1. W naszym przykładzie sekwencja stanów ma długość 15 i jedynie stan 
0000 nie może do niej należeć, gdyż układ nie ma możliwości wyjścia z tego stanu. 
W przedstawionej na rysunku 3.30b sekwencji stanów trudno doszukać się jakiejś regular- 
ności. Dlatego licznik łańcuchowy jest często wykorzystywany jako generator sekwencji 
tzw. pseudoprzypadkowej. W przedstawionym przykładzie wykorzystuje się sprzężenie 
zwrotne, które jest sumą mod 2 wyjść przedostatniego i ostatniego przerzutnika. Poleca się 
Czytelnikowi sprawdzenie czy sekwencją stanów takiego układu będzie rzeczywiście 
sekwencja podana na rysunku 3.30b. 


a b 
0110 
u o | 0101 
| 1010 
Rejestr przesuwający 1101 
ZEG 0110 


Rysunek 3.31. Gencrator sekwencji 


Za pomocą rejestru z rysunku 3.27 można zbudować generator dowolnej sekwencji 
(oczywiście o określonej długości) projektując układ jak na rysunku 3.31a. Na przykład 
jeśli układ kombinacyjny UK realizuje funkcję negacji sumy Q Q,+ Q;Q,, to sekwencja 
stanów ma długość 5 i są to stany: 0110, 1011, 0101, 1010 i 1101 (rys. 3.31b). 
Zainteresowanemu Czytelnikowi zaleca się próbę opracowania sposobu projektowania 
takiego generatora dla zadanej sekwencji wyjściowej. 


LICZNIKI 


W poprzednim podrozdziale omówiono zastosowania rejestrów przesuwających jako licz- 
ników. Zliczane były impulsy zegarowe. Teraz rozpatrzymy inne układy zliczające rozpo- 
czynając od układu pokazanego na rysunku 3.32. Ponieważ na wejścia przerzutników typu 
T (por. Dodatek) podano na stałe 1, to pierwszy przerzutnik Q, zmienia swój stan przy 
każdym impulsie zegarowym (z definicji tego przerzutnika). Wyjście tego przerzutnika 
steruje wejściem zegarowym następnego stopnia, a więc przerzutnik Q, zmienia swój stan 
przy każdym impulsie pojawiającym się na wyjściu przerzutnika Q,. Podobnie przerzut- 


a b ze JLILILILILILILILTLIL 
w] A. 1.1 1.3 dach 2 


Q1 Q2 Q3 
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Rysunek 3.32. Licznik poprzednikowy 
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nik Q, zmienia swój stan przy każdym impulsie pojawiającym się na wyjściu przerzutni- 
ka Q,. Wykres czasowy na rysunku 3.32b ilustruje przebiegi zmian przerzutników na tle 
przebiegu zegarowego. Założono, że przerzutnik zmienia stan w czasie dodatniego (z O na 
l) zbocza wejścia zegarowego. Okres licznika (liczba stanów) wynosi 8, a kolejność 
stanów przedstawiana w kodzie binarnym zmienia się według porządku 7, 6, 5, 4, 3, 2, 1 
i 0. Taki licznik nazywa się licznikiem poprzednikowym (ang. up-down counter). 


Q1 Q2 Q3 
T Q T ql- T Q e 7 10 a 1.) kz 
: | | EEE Ga A 
>+ CLK Q CLK Q CLK Q Q2 —— 


Rysunek 3.33. Licznik następnikowy 


Na rysunku 3.33a przedstawiono licznik działający na podobnej zasadzie tylko z in- 
nym wysterowaniem wejść zegarowych. Sekwencja takiego układu to stany O, I, 2, 3,4, 5, 
6 1 7. Taki licznik nazywa się licznikiem następnikowym (ang. bottom-up counter). 
Niekiedy istnieje potrzeba dynamicznej (w czasie pracy licznika) zmiany kierunku liczenia 
(poprzednikowy na następnikowy lub odwrotnie). Można to osiągnąć wprowadzając dodat- 
kowe wejście sterujące, a takie liczniki są nazywane licznikami rewersyjnymi. 


Przedstawione liczniki są licznikami szeregowymi (asynchronicznymi), gdyż zmiany 
stanów kolejnych przerzutników następują z pewnym opóźnieniem względem siebie. Może 
to powodować pewne niekorzystne zjawiska, szczególnie podczas dekodowania stanów 
(hazard — powstawanie na wyjściach dekodera impulsów fałszywych). Dlatego często 
stosuje się liczniki równoległe (synchroniczne), w których wszystkie przerzutniki zmienia- 
ją swoje stany jednocześnie, synchronicznie z przebiegiem zegarowym. 


Na rysunku 3.34 pokazano wejścia i wyjścia typowego 4-bitowego licznika. Licznik 
jest wyposażony w wejście zegarowe CLK oraz w cztery wejścia sterujące. Wejście steru- 
jące LD (ang. load) jest wejściem synchronicznym i służy do wpisywania danych z wejść 
D,-D;. Wejście zerujące CLR (ang. clear) jest także wejściem synchronicznym. Ponadto 
są dwa wejścia dostępu: CEP (ang. count enable parallel) umożliwiające zliczanie i CET 
(ang. count enable trickle) umożliwiające powstanie przeniesienia TC (ang. terminal 
count). Wyjście TC służy do rozbudowywania licznika, tj. do łączenia go z innymi takimi 
samymi układami. 


Rysunek 3.34. Typowy licznik czterobitowy 
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Rysunek 3.35. Kaskadowce połączenie liczników 


Na rysunku 3.35 pokazano sposób łączenia trzech 4-bitowych liczników celem zwięk- 
szenia jego okresu do 4096 stanów. W układzie występuje pełny synchronizm z prze- 
biegiem zegarowym, gdyż wszystkie przerzutniki wszystkich liczników zmieniają swoje 
stany jednocześnie. Pozwala to na prawidłowe dekodowanie tych stanów, bez szkodliwego 
zjawiska hazardu. 


TC 


cLk Licznik 
J LD 


Rysunek 3.36. Licznik o okresie 11 


Często występuje problem projektowania liczników nie tylko o różnych okresach, 
ale 1 o różnych sekwencjach stanów. Rozpatrzmy działanie układu z rysunku 3.36. W tym 
układzie licznik po osiągnięciu stanu 1111 generuje sygnał TC, który jest podawany na 
wejście LD, co ma spowodować załadowanie do licznika nowej zawartości. Zatem w cza- 
sie następnego impulsu zegarowego do licznika zostanie wpisana wartość z jego wejść. 
W naszym przykładzie będzie to stan 1010 (dziesiętnie 5). Okres takiego licznika wynosi 
16-5 = 11, a sekwencja stanów przebiega od 1010 do 1111. 


Przedstawione teraz będzie działanie układu z rysunku 3.37. W tym przypadku licznik 
jest zerowany, gdy pojawi się na jego wyjściach stan 1101. Jego sekwencja stanów 


Rysunek 3.37. Licznik o okresie 14 
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zmienia się od stanu 0000 do detekowanego stanu (w przykładzie będzie to stan 1101 — 
dziesiętnie 13). Bramka NAND dekoduje stan 13, a jej wyjście steruje wejściem zerującym. 
Powoduje to, że po osiągnięciu stanu 13 następnym stanem będzie stan 0, a nie stan 14. 
Zatem licznik taki jest licznikiem 14-stanowym. 


3.2. KODY BINARNE I ARYTMETYKA 


3.2.1. KODY BINARNE 


W poprzednim podrozdziale były wymienione niektóre kody dwójkowe, które ułatwiały 
reprezentację sygnałów wejściowych i wyjściowych układów logicznych. W tablicy 3.3 
zestawiono słowa kodowe naturalnego kodu binarnego NKB, kodu Graya, kodu „1 zn” 
kodu dwójkowo-dziesiętnego BCD oraz kodu Johnsona odpowiadające cyfrom od O do 9. 


p 


Tablica 3.3. Kody binarne 
NL NN NN o 
NKB Gray lz10 BCD Johnsona 


0000 0000 1000000000 0000 00000 
1000 1000 0100000000 1000 10000 
0100 1100 0010000000 0100 11000 
1100 0100 0001000000 1100 11100 
0010 0110 0000100000 0010 11110 
1010 1110 0000010000 1010 11111 
0110 1010 0000001000 0110 Oll 
1110 0010 0000000100 1110 00111 
0001 0011 0000000010 0001 00011 


1001 1011 0000000001 1001 00001 
aaaea 


O oo JOU R W NM -— O 


W ogólnym przypadku minimalna długość k słowa binarnego reprezentującego liczbę 
dziesiętną A musi spełniać warunek: 


A<2' <2A+1 


Przedstawione w tablicy słowa kodów NKB i Graya mają długość minimalną, tj. 
4 pozycje binarne. Długość słowa kodu „1 z n” jest równa n, tj. liczbie kodowanych słów. 
W tablicy 3.3 wynosi ona 10. Kod Johnsona stosowany do kodowania cyfr dziesiętnych 
jest 5-bitowy. Kod BCD jest powszechnie stosowany w takich systemach, gdzie wygodnie 
jest operować w systemie liczbami dziesiętnymi. Liczba tetrad (czwórek bitów) kodu 
BCD jest równa liczbie pozycji dziesiętnych reprezentowanej liczby. Na przykład dzie- 
siętna liczba 6-pozycyjna (000000—999999) jest kodowana na 24 bitach. Przedstawione 
kody „1 z n” i Johnsona są tzw. kodami nadmiarowymi (redundancyjnymi), które charak- 
teryzują się tym, że liczba pozycji binarnych jest większa niż wynika to z wyżej podanej 
zależności. Redundancję można wykorzystać do zwiększania niezawodności operacji 
wykonywanych na tych liczbach. Na przykład stosując kod „I zn” można, w czasie wy- 
konywania operacji, kontrolować liczbę jedynek w każdym słowie. Wykrycie braku jedynki 
albo wykrycie dwóch lub więcej jedynek wskazuje na powstały błąd. Taki sposób kontroli 
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poprawności można wykorzystywać np. przy transmisji informacji. Jeżeli kontrola daje 


negatywny rezultat, to transmisję można unieważnić lub powtórzyć. 


Tablica 3.4. Kody nadmiarowe 


3/ 


2z5 z nadmiarem 3 HEX zbitem P Kod korekcyjny 
0 01100 0011 0000 1 0000 000 
1 10001 0100 0001 0 0001 111 
2 10010 0101 00100 0010 011 
3 00011 0110 0011 1 0011 100 
4 10100 0111 0100 0 0100 101 
5 00101 1000 0101 1 0101 010 
6 00110 1001 01101 0110 110 
7 11000 1010 01110 0111 001 
8 01001 1011 1000 0 1000 110 
9 01010 1100 1001 1 1001 001 
10 1010 1 1010 101 
11 10110 1011 010 
12 1100 1 1100 011 
13 11010 1101 100 
14 11100 1110 001 
15 1111 1 1111 111 


Niektóre kody nadmiarowe zestawiono w tablicy 3.4. Kod „2 z 5” jest kodem 5-bito- 
wym dla cyfr od O do 9. Istnieje tylko 10 kombinacji binarnych, które na 5 pozycjach 
każdego słowa mają dwie jedynki. Poprawność operacji na takich słowach można spraw- 
dzać przez kontrolę liczby jedynek. Kod „z nadmiarem 3” (ang. excess 3) ma własność 
samodualności, tj. jeżeli L(A) jest wartością dziesiętną słowa binarnego A, to prawdziwa 
jest zależność 


L(A)=9-L(A) 


Kod HEX jest nazywany kodem szesnastkowym (ang. hexadecimal), który na czte- 
rech pozycjach binarnych przedstawia kody 16 znaków alfanumerycznych. Pierwsze 10 to 
cyfry dziesiętne jak w kodzie BCD, tj. od 0 do 9. Następnych sześć, które odpowiadają 
liczbom dwucyfrowym 10, 11, 12, 13, 14 i 15 oznacza się literami A, B, C, D, E i F. 


W tablicy 3.4 każdemu słowu kodu BCD dodano tzw. bit parzystości, który ma war- 
tość 1, gdy w danym słowie jest nieparzysta liczba jedynek i wartość 0, gdy jest ona 
parzysta. W tak utworzonym kodzie każde słowo zawiera parzystą liczbę jedynek. Niekiedy 
stosowane są także kody z bitem nieparzystości, tj. takie, które uzupełniają słowo do 
nieparzystej liczby jedynek. 


W ostatniej kolumnie tablicy 3.4 przedstawiono kod korekcyjny, tj. kod, który jest 
stosowany nie tylko do detekcji błędów, ale także do ich poprawiania. W tablicy pokazano 
kod szesnastkowy wraz z 3 dodatkowymi bitami. Każdy z tych 3 bitów jest bitem 
parzystości dla 3 różnych pozycji kodu szesnastkowego. Oznaczmy bity kodu szesnastko- 
wego przez D1, D2, D3 i D4, przy czym najmniej znaczący bit D1 jest po lewej stronie 


38 3. Podstawy techniki cyfrowej 
Dni o, Zz O WY TEISTO E] 


słowa kodowego. Oznaczmy przez P1, P2 i P3 bity parzystości, przy czym po lewej 
stronie słowa jest bit P1. Bity P, są obliczane według zależności: 

P1 = D1 ® D2 ® D3 

P2 = DI ® D2 © D4 

P3 = D1 © D3 © D4 
gdzie ® oznacza operację sumy mod 2. Czwartą możliwą kombinację (P4 = D2 © D3 © 
D4) pominięto. 


Załóżmy teraz, że w omawianym kodzie może powstać przekłamanie tylko na jednej 
pozycji. Jeśli nastąpiło ono na pozycji D1, to wszystkie 3 pozycje Pi będą miały 
nieprawidłową wartość. Jeśli nastąpiło na pozycji D2, to tylko P1 i P2 będą miały 
nieprawidłową wartość. Jeśli przekłamanie wystąpi na pozycji D3, to nieprawidłowe będą 
P1 i P3, a jeśli na D4, to P2 i P3. Wszystkie te przypadki zestawiono w tablicy 3.5. 


Tablica 3.5. Przypisanie pojedynczym błędom zmian na pozycjach słowa parzystości 
Powstał błąd na pozycji: Słowo z jedynkami na pozycjach 


różniących się słów parzystości 
aaa .75ÓŚÓQÓóÓóóÓóÓóÓóÓóÓóÓóÓóÓó 


DI 111 
D2 011 
D3 101 
D4 110 
P1 001 
P2 010 
P3 100 


Rozważania zilustrujmy następującym przykładem. Załóżmy transmisję ciągu binar- 
nego przez kanał informacyjny. Niech na wejściu kanału będzie słowo kodowe 1101 
(D1, D2, D3, D4). Obliczone dla niego słowo korekcyjne to 010 (P1, P2, P3). Załóżmy, że 
w czasie transmisji nastąpiło przekłamanie na bicie D3 i na wyjściu kanału odebrano 
słowo 1111 010. Kontrola słowa bitów parzystości słowa wyjściowego daje negatywny 


Tablica 3.6. Wymagane długości słów korckcyjnych dla różnych długości słów danych 


Liczba | 


bitów 


Korekcja pojedynczego | Korekcja pojedynczego 
błędu błędu i detekcja dwóch 
Liczba Liczba bitów 

bitów słowa słowa 


Procent 
długości 


Procent 
długości 


korekcyjnego korckcyjnego 


8 4 5 62,5 
16 5 31,25 6 37,5 
32 6 18,75 7 21,875 
64 7 10,94 8 12,5 

128 8 6,25 9 7,03 
256 9 3,52 10 3,91 
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wynik, gdyż obliczone dla słowa 1111 bity parzystości to 111. Dokonuje się wówczas 
porównania słów korekcyjnych (słowa korekcyjnego obliczonego na podstawie odebranych 
bitów i odebranego słowa korekcyjnego) przez operację sumy mod 2 tych bitów. W naszym 
przykładzie w wyniku tego otrzymamy słowo 101. Wynik ten wskazuje, że bity słowa 
parzystości różnią się na pozycjach P1 i P3. Jak wynika z poprzedniego opisu i z tablicy 3.5, 
wskazuje to na błąd na trzeciej pozycji, tj. D3. Po detekcji tego błędu można dokonać jego 
korekcji zmieniając wartość pozycji D3 słowa otrzymanego na wyjściu kanału (w tym 
przykładzie z 1 na 0). 


Przedstawiony kod korekcyjny dla pojedynczego błędu wymagał aż 3 bitów parzys- 
tości dla 4 bitów kodu. Stanowi to 75% długości samego kodu. W tablicy 3.6 zestawiono 
porównanie wymaganych długości słów korekcyjnych dla dwóch przypadków: w pierwszej 
kolumnie dla korekcji pojedynczego błędu oraz w drugiej kolumnie dla korekcji po- 
jedynczego błędu, ale detekcji podwójnego błedu. 


W systemach cyfrowych występuje często potrzeba transmisji znacznie dłuższych 
ciągów niż przedstawione. W związku z tym rośnie także długość słów detekcyjnych 
i korekcyjnych. Jednym z często stosowanych rozwiązań jest wykorzystanie tzw. słowa 
kontrolnego CRC (ang. cyclic redundancy code). Jeden bit tego słowa powstaje jako bit 
parzystości dla co k-tego bitu danego ciągu. Jeżeli mamy ciąg o długości 1024 bity 
i przyjmiemy, że k = 64, to słowo kontrolne będzie miało długość 16 bitów. Każdy z tych 
bitów jest bitem parzystości dla podciągu składającego się z co 64 bitu danego ciągu. 


Na zakończenie tego podrozdziału przedstawiono kod stosowany dla znaków alfa- 
numerycznych, tj. dla cyfr, liter, znaków pisarskich i znaków redakcyjnych sterujących. 
Kod ten jest znany jako kod ASCII (ang. American Standard Code for Information 
Interchange) lub też jako kod ISO (International Standard Organization). W tablicy 3.7 
przedstawiono 7-bitowy kod i odpowiadające jego słowom znaczenia. W kolumnach 


Tablica 3.7. Standardowy kod ASCII 


000 100 010 110 001 101 011 111 


0000 NUL DLE SPACE 


0 @ P p 
1000 SOH DCI ! 1 A Q a q 
0100 STX DC n 2 B R b r 
1100 ETX  DC3 # 3 C S c s 
0010 EOT  DC4 $ 4 D T d t 
1010 ENO NAK % 5 E U e u 
0110 ACK SYN © 6 F V f v 
1110 BEL ETB i 7 G W g w 
0001 BS CAN ( 8 H X h x 
1001 HT EM ) 9 I Y i y 
0101 LF SUB * : J Z j z 
1101 VT ESC + ; K [ k { 
0011 FF FS SE < L \ 1 | 
1011 CR GS 5 = M ] m ) 
0111 SO RS > N A n 
1111 SI US / ? O o DEL 
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oznaczonych 000 i 100 są umieszczone redakcyjne znaki sterujące, których znaczenia 
tutaj podawać nie będziemy. 


3.2.2. STAŁOPOZYCYJNA REPREZENTACJA LICZB 


W poprzednim podrozdziale przedstawiono kody binarne, które znalazły zastosowanie 
przy projektowaniu układów logicznych 1 do reprezentacji liczb naturalnych. Natomiast do 
reprezentacji liczb całkowitych stosowane są trzy inne kody, a mianowicie: 

— zapis znak-moduł, 

— zapis Ul, 

— zapis U2. 


Kody te są nazywane zapisami stałopozycyjnymi (ang. integer) od umieszczenia przecinka 
w stałej pozycji. Do przedstawiania zaś liczb ułamkowych stosowany jest zapis zmienno- 
-pozycyjny (ang. floating-point). W tym podrozdziale omówione będą kolejno te zapisy. 


Zapis znak-moduł ZM (ang. sign-magnitude) utworzono przez dodanie jednego bitu 
do zapisu NKB. Bit ten, dodawany przed najbardziej znaczącą pozycją słowa, jest bitem 
znaku. Wartość tego bitu równa O oznacza liczbę dodatnią, a 1 liczbę ujemną. Dalsze bity 
w zapisie NKB oznaczają moduł tej liczby. Zakres prezentowanych liczb jest różny 
w zależności od długości słowa. Dla słów 16-bitowych można przedstawiać liczby z za- 
kresu —2 +1 <A<+2'-1 ponieważ największą liczbą zakodowaną na 15 bitach jest 
2'—]. W zapisie znak-moduł występują dwie reprezentacje zera. Jest to zarówno słowo 
000000...00, jak i słowo 100000...00. 


Drugim zapisem stosowanym dla liczb całkowitych jest zapis uzupełnień do 1, tzw. U! 
(ang. Is complement). W zapisie tym najbardziej znaczący bit jest także bitem znaku 
(0 — liczba dodatnia 1 1 — liczba ujemna), ale w zależności od jego wartości dalsze bity 
zapisu mają różne znaczenie. Jeśli bit znaku jest O (liczba dodatnia), to dalsze bity są 


Tablica 3.8. Reprezentacja liczb w różnych zapisach 


Liczba ZM U1 U2 BIAS BCD 

-127 11111111 10000000 10000001 00000001 1000100100111 

-126 11111110 10000001 10000010 00000010 1000100100110 
-] 10000001 11111110 11111111 01111111 1000000000001 
0 10000000 11111111 00000000 10000000 1000000000000 
0 00000000 00000000 00000000 10000000 0000000000000 
l 00000001 0000000 1 00000001 10000001 0000000000001 
2 00000010 00000010 00000010 10000010 0000000000010 
3 00000011 00000011 00000011 10000011 0000000000011 
4 00000100 00000100 00000100 10000100 0000000000100 

+126 01111110 01111110 01111110 11111110 0000100100110 

+127 01111111 01111111 01111111 11111111 0000100100111 
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reprezentacją liczby dodatniej w kodzie NKB. Natomiast gdy bit znaku jest 1 (liczba 
ujemna), to dalsze bity reprezentują moduł liczby ujemnej, w taki sposób, że zanegowane 
ich wartości odpowiadają modułowi tej liczby w kodzie NKB (por. tabl. 3.8). Zakres liczb 
tego zapisu jest taki sam jak dla zapisu znak-moduł, a liczba zero ma także dwie re- 
prezentacje. 


Trzecim zapisem jest zapis uzupełnień do 2 czyli tzw. U2 (ang. 2s complement). Zapis 
ten różni się od U1 tylko dla liczb ujemnych. Moduł liczby ujemnej zapisanej w kodzie U2 
jest obliczany w taki sposób, że do zanegowanych pozycji słowa jest arytmetycznie 
dodawana jedynka i dopiero tak utworzone słowo odpowiada w kodzie NKB modułowi tej 
liczby. Celowość tego zapisu wyjaśniono w następnym podrozdziale przy omawianiu 
arytmetyki binarnej. 


Zapis liczb ułamkowych (liczb zmiennopozycyjnych) omówiono w podrozdzia- 
le 3.2.4. Tutaj przedstawiono jeszcze tzw. zapis polaryzowany (ang. bias), który jest po- 
mocny przy tworzeniu liczb w zapisie zmiennopozycyjnym. Zapis polaryzowany przedsta- 
wia liczby w taki sposób, że O jest reprezentowane przez n-bitowe słowo 1000...00, a więc 
przez liczbę 2™! kodu NKB. Wszystkie inne liczby A są przedstawiane na n pozycjach 
jako binarne wartości liczby 2" '+A. 


W tablicy 3.8 przedstawiono 8-bitowe liczby (z bitem znaku) w omówionych już 
zapisach i w zapisie BCD. W tym ostatnim przypadku przedstawiono zapis 12-bitowy 
wraz z 13 bitem znaku, tj. dziesiętne liczby trzycyfrowe (3 tetrady). 


3.2.3. ARYTMETYKA STAŁOPOZYCYJNA 


Najczęściej do reprezentacji liczb całkowitych (stałopozycyjnych) w procesorach kompu- 
terów są stosowane przedstawione wyżej kody U1, U2 i znak-moduł. Ponieważ jednak 
także spotykane są realizacje bloków ALU pracujących w kodzie BCD, to dalej przed- 
stawiono algorytmy wykonywania 4 podstawowych działań arytmetycznych dla 4 wymie- 
nionych zapisów. Algorytmy będą zilustrowane przykładami. Pominięto zapis polaryzo- 
wany, gdyż nie jest on stosowany w arytmetyce stałopozycyjnej. 


DODAWANIE I ODEJMOWANIE 


Operacje dodawania i odejmowania przedstawiono łącznie, gdyż operację odejmowania 
można zastąpić operacją dodawania dwóch liczb z jednoczesną zamianą znaku jednej 
znich. Rozpatrzono zatem dwa przypadki: pierwszy dodawania dwóch liczb dodatnich 
i drugi dodawania dwóch liczb o przeciwnych znakach. 


Przypadek 1. Jeżeli obie liczby są dodatnie, to operacja dodawania jest wykonywana 
w identyczny sposób dla zapisów Ul, U2 i znak-moduł. Pokazane to będzie na przykładzie 
dwóch liczb: + 89 i + 45. Dla zapisów ZM, U1 i U2 reprezentacja tych liczb jest taka sama 
i przedstawimy je jako liczby 8-pozycyjne. Dla zapisu BCD założymy 9 pozycji (dwie 
tetrady i bit znaku). W zapisach ZM, Ul i U2 na najbardziej znaczącej pozycji powstało 
przeniesienie (jedynka w nawiasie), co oznacza, że wynik dodawania jest liczbą większą 
od 128. Wynikiem dodawania jest zatem +6 oraz przeniesienie +128. Przy dodawaniu w 
zapisie BCD na obu tetradach powstały słowa nie należące do kodu BCD. W takim 
przypadku należy dokonać korekcji, która polega na dodaniu liczby sześć do tych tetrad, 
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które przekroczyły zakres. W przykładzie korekcja dotyczy obu tetrad. W następnym 
kroku trzeba uwzględnić powstałe przeniesienia na odpowiednich tetradach. Przeniesienia 
po korekcji powstały na obu tetradach. Dlatego do drugiej tetrady dodawane jest prze- 
niesienie powstałe na pierwszej tetradzie, a przeniesienie powstałe na drugiej tetradzie ma 
wagę dziesiętną 100 (liczba w nawiasie). Ponieważ tetrada pierwsza ma wartość 4, a druga 
ma wartość 3, to wraz z przeniesieniem daje poprawny wynik dodawania. 


Tablica 3.9. Dodawanie liczb dodatnich 


Wartości Wartości w zapisach Wartości w kodzie BCD 
dziesiętne ZM U1 U2 


89 0 1011001 0 1000 1001 
+45 0 0101101 0 0100 0101 
+134 (1) 00000110 0 1100 1110 
korekcja + 0110 0110 

0010 0100 

+ (1) 


(1) 0011 0100 


Przypadek 2. Rozpatrzony będzie teraz przypadek, gdy liczby mają przeciwny znak. 
Pokazane to będzie na przykładzie dodawania dwóch 5-bitowych liczb, z których jedna 
jest ujemna (+9 i -7). W tablicy 3.10 pokazano tę operację dla wszystkich 4 zapisów. Dla 
zapisu ZM i BCD (operacja ta jest najtrudniejsza) algorytm postępowania jest następujący: 

a) porównać moduły obu argumentów i przyjąć jako znak wyniku znak liczby o 

większym module, 

b) od większego modułu odjąć moduł mniejszy. 


Pierwszy krok tego algorytmu nie nastręcza większych trudności, natomiast wyjaśnienia 
wymaga sposób odejmowania liczb w kodzie NKB i BCD. Celem pokazania tego sposobu 
rozpatrzone będą dwa przypadki: 

— jeżeli na danej pozycji odjemna jest równa 1, 

— jeżeli na danej pozycji odjemna jest równa 0. 


Tablica 3.10. Odcjmowanie liczb w różnych zapisach 


ZM U1 U2 BCD 
+9 0 1001 0 1001 0 1001 0 1001 
-7 + 101ll + 11000 +1 1001 + 10111 
+2 0 0010 (1) 00001 (1) 00010 0 0010 
+ l 
0 0010 
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Jeżeli na danej pozycji odjemna jest równa l, to mamy odejmowanie: 


l l 
| z0 
0 1 


Jeżeli natomiast na danej pozycji odjemna jest równa 0, to dalsza procedura zależy od 
wartości odjemnika na tej pozycji. W przypadku gdy odjemnik jest równy 0, to wynik jest 
równy 0. W przypadku gdy odjemnik jest równy 1, to wynik też jest równy 1, ale oznacza 
to wykorzystanie tzw. pożyczki z bardziej znaczącej pozycji. Jeżeli na bardziej znaczącej 
pozycji jest 1, to zapożyczenie polega na zamianie tej jedynki na zero. Jeżeli natomiast na 
tej pozycji jest 0, to trzeba dokonać pożyczki z jeszcze bardziej znaczącej pozycji itd. 
Pożyczka powoduje, że kolejne zera będą zmieniały się na jedynki, aż do napotkania 
pierwszej jedynki. 

Dla przykładu z tablicy 3.10 mamy: 


pożyczka (0000) (0110) (0110) (0110) 
1001 010x Olxx 0Oxxx 
-0111 01lix 0lxx 0Oxxx 
xxxx xxl0 x010 0010 


Ponieważ algorytm przewiduje, że odejmuje się zawsze liczbę, której moduł jest mniejszy 
od liczby, której moduł jest większy, pożyczka nie wykracza poza pozycje odjemnej 
i wynik jest zawsze dodatni. 


Operacja odejmowania jest łatwiejsza dla zapisów U1 i U2. W zapisie U1 algorytm 
odejmowania polega na dodawaniu wszystkich pozycji liczby wraz z bitem znaku oraz 
uwzględnieniu powstałego przeniesienia. Oznacza to, konieczność korekcji wyniku w przy- 
padku powstania przeniesienia. Korekcja polega na dodaniu przeniesienia (jedynki) do 
najmniej znaczącej pozycji wyniku. Jest to wada tego zapisu, która powoduje wydłużanie 
czasu trwania operacji arytmetycznych. Wadę tę wyeliminowano przy operacjach w zapisie 
U2. W zapisie U2 algorytm odejmowania jest po prostu dodawaniem wszystkich pozycji 
wraz z bitem znaku. Jeżeli powstanie przeniesienie na bicie znaku, to jest ono ignorowane. 
Zatem algorytm w zapisie U2 daje zawsze poprawny wynik w mniejszej liczbie kroków 
niż w zapisie U1. 


MNOŻENIE 
Przedstawione zostaną tutaj algorytmy mnożenia kolejno dla zapisów: ZM, U1 i U2. 
Algorytm mnożenia dla zapisu znak-moduł 


Algorytm mnożenia liczb w kodzie z-m można sprowadzić do dwóch kroków: 
— porównanie bitów znaku i przyjęcie znaku wyniku, 
— wykonanie mnożenia modułów. 


W pierwszym kroku, jeżeli znaki obu liczb są różne (suma mod 2 bitów znaków jest równa 
jeden), to wynik jest ujemny i bit znaku wyniku jest 1. Jeżeli znaki są takie same (suma 
mod 2 tych bitów jest równa 0), to wynik jest dodatni i bit znaku wyniku jest równy 0. 
W drugim kroku dokonuje się mnożenia modułów obu liczb. Algorytm mnożenia można 
wykonać podobnie do mnożenia dwóch liczb dziesiętnych „na papierze”. 
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Rysunek 3.38. Mnożenie dwóch liczb czterobitowych 


rejestr RH 
0000 
+ 0000 
0000 
SHR 0000 
+ 0101 
0101 
SHR 0010 
+ 0101 
(0: SA BIELI 
SHR 0011 
+ 0000 
0011 
SHR 0001 


RL 
O 1 


Rysunek 3.39. Mnożenie dwóch liczb w kodzie NKB 


kierunek | 
przesuwania : 
(w prawo) y 


sterowania 


Rysunek 3.40. Układ realizujący operację mnożenia 


RO|R O 
OJO re 


10 
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0101 


Na rysunku 3.38 pokazano przykładowe mnożenie dwóch dodatnich liczb 4-bitowych 
(dziesiętnie 5 i 6). Wynik mnożenia ma dwa razy większą długość niż argumenty. Do 
realizacji algorytmu mnożenia stosuje się najczęściej układ składający się z sumatora 
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idwóch rejestrów. Jeden z nich jest rejestrem o długości równej długości słowa 
argumentów, a drugi o podwójnej długości, w którym, w kolejnych krokach, będzie 
powstawał wynik. W naszym przykładzie pierwszy rejestr będzie rejestrem 4-bitowym 
(dalej oznaczanym przez M), a drugi rejestr będzie rejestrem 8-bitowym (dalej oznaczanym 
przez R). Ten ostatni rejestr będzie podzielony na dwie części: mniej znaczą część ozna- 
czoną przez RL i bardziej znaczącą część oznaczoną przez RH. 


Na rysunku 3.39 pokazano kolejne 4 kroki algorytmu mnożenia w opisywanym ukła- 
dzie oraz stany rejestrów w każdym z kroków. Najpierw do rejestru o podwójnej długości 
R jest zapisywana mnożna na mniej znaczące pozycje. Na bardziej znaczące pozycje 
wpisywane są zera. Do rejestru M jest zapisywany mnożnik. W każdym kroku mnożenia 
wykonywane są dwie operacje: warunkowe dodawanie i przesuwanie w prawo (SHR). 
Operacja dodawania jest warunkowa, gdyż jest uzależniona od wartości aktualnego 
najmniej znaczącego bitu rejestru mnożnej. Jeżeli wartość tego bitu jest 0, to do bardziej 
znaczącej części rejestru mnożnej dodaje się zera. Jeżeli wartość tego bitu jest 1, to do 
rejestru mnożnej dodawana jest wartość mnożnika. Zaleca się niewprawnemu Czytelnikowi 
dokładne prześledzenie kolejnych kroków algorytmu. 


Na rysunku 3.40 pokazano układ realizujący opisany algorytm. Układ sterowania 
generuje sygnał przesuwania zawartości rejestru R oraz sygnał sterujący układem ALU. 
Układ ALU opisano w rozdziale 4, natomiast teraz wystarczy przyjąć, że do zawartości 


RH=0 
M<-MNOŹNIK 
RL<—MNOŻNA 
STERN 


RLERL+M 


Przesunięcie 
w prawo 


Rysunek 3.41. Algorytm operacji mnożenia liczb w kodzie NKB 
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rejestru R dodaje on albo 0 albo zawartość rejestru mnożnika M. Ponieważ podczas 
dodawania na wyjściu bloku ALU może powstać przeniesienie, to do rejestru R dołączono 
dodatkowo jednobitowy rejestr C, którego zawartość też jest przesuwana wraz z zawartoś- 
cią rejestru R. 


Algorytm działania tego układu w postaci sieci działań pokazano na rysunku 3.41. 
W pierwszym kroku do odpowiednich rejestrów wpisywane są początkowe wartości: 
— do RH wpisywane jest 0, 
— do RL wpisywana jest mnożna, 
— do rejestru M wpisywany jest mnożnik, 
— układ sterowania programuje się na odpowiednią liczbę kroków, równą liczbie 
bitów mnożonych liczb. 


W drugim kroku sprawdza się wartości najmniej znaczącego bitu rejestru RL. Na tej 
podstawie układ sterowania podejmuje decyzję czy nastąpi operacja dodawania, czy nie. 
W algorytmie pominięto wyznaczenie znaku wyniku. Jak łatwo zauważyć można to 
wykonać biorąc bramkę sumy mod 2, na której wejścia podano bity znaków obu argu- 
mentów. 


Algorytm mnożenia dla zapisu Ul 


Algorytm mnożenia w zapisie Ul przewiduje różne operacje w zależności od znaku 
czynników. Jeśli oba czynniki mają ten sam znak, to algorytm przebiega podobnie jak dla 
kodu NKB. Jeśli znaki obu liczb są dodatnie, to algorytm mnożenia w kodzie NKB stosuje 
się bezpośrednio. Jeśli znaki liczb są ujemne, to algorytm stosuje się po zmianie tych 


RH RL M 
0000 0101 1001 
+ 1001 
1001 0101 
SHR 1100 1010 
+ mm 
I 1011 1010 
+ l 
1100 1010 
SHR 1110 0101 
+ 1001 
| 0111 0101 
+ l 
1000 0101 
SHR 1100 0010 
+ 1111 
l 1011 0010 
+ l 
1100 0010 


SHR 1110 0001 


Rysunek 3.42. Algorytm opcracji mnożenia liczb w kodzie Ul 
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znaków. Jeżeli natomiast znaki czynników są przeciwne, to jako mnożną wybiera się 
liczbę dodatnią. Operację mnożenia w zapisie Ul zilustrowano przykładem mnożenia 
liczb -6 i +5 przedstawionym na rysunku 3.42. 


Do rejestru RH (do bardziej znaczącej części R) wpisano wartość zero (Czytelnik 
łatwo może zauważyć, że taki sam wynik można otrzymać wpisując jako początkową 
wartość w tym rejestrze —0, tj. same jedynki). Do rejestru RL wpisano dodatnią mnożną, a 
do rejestru M ujemny mnożnik. Należy zauważyć, że po każdej operacji dodawania, w 
której powstaje przeniesienie, następuje korekcja tej operacji przez dodanie jedynki. 
Przesuwanie zawartości rejestru w prawo wymusza lewostronne wpisywanie jedynek, gdy 
liczba w rejestrze R jest ujemna lub zer, gdy liczba w R jest dodatnia. Jeżeli najmniej 
znacząca pozycja rejestru RL jest 0, to do rejestru RH dodawane jest O (czyli same jedynki 
lub same zera). Wynikiem mnożenia jest liczba —30 zapisana w kodzie Ul. Na 
rysunku 3.43 przedstawiono sieć działań odpowiadającą temu algorytmowi. 


Algorytm mnożenia dla zapisu U2 


Rozpatrzmy teraz mnożenie dwóch liczb w kodzie U2. Na rysunku 3.44 pokazano kolejne 
zawartości rejestrów dla mnożenia dwóch czterobitowych liczb —3 i —2. 


R<HO 
C0 

M<—MNOŻNIK 
RL--MNOŻNA 
STERN 


Rysunek 3.43. Algorytm mnożenia dwóch liczb w kodzie Ul 
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a b 
RH RL M RH RL M 
0000 1110 1101 0000 1110 1101 
+ 0000 0000 
0000 1110 0000 1110 
SHR 0000 0111 0000 0111 
w 1101 1101 
1101 0111 1101 0111 
SHR 1110 1011 1110 1011 
t 1101 1101 
1011 1011 1011 1011 
SHR 1101 1101 1101 1101 
w 1101 + 0011 
1010 1101 0000 1101 
SHR 1101 0110 0000 0110 
+ 0011 
0000 0110 


Rysunek 3.44. Mnożenie dwóch liczb w kodzie U2 


Po wyzerowaniu rejestru RH (w zapisie U2 zero ma tylko jedną postać), zapisaniu do 
rejestru RL mnożnej, a do rejestru M mnożnika, w pierwszym kroku przedstawianego 
algorytmu do rejestru RH dodawane jest zero, gdyż najmniej znacząca pozycja rejestru RL 
wynosi 0. W następnych krokach jest dodawany mnożnik. Po 4 krokach w rejestrze R 
znajduje się wartość 1101 0110, a więc nie jest to prawidłowy wynik mnożenia. 


Algorytm mnożenia ma różną postać w zależności od znaku mnożnej (liczby w re- 
jestrze R). Jeśli mnożna jest dodatnia, to algorytm nie różni się od algorytmu mnożenia dla 
liczb w kodzie NKB (zaleca się Czytelnikowi sprawdzenie). Jeśli natomiast mnożna jest 
ujemna, to wynik mnożenia, otrzymany po właściwej dla danej długości słowa liczbie 
kroków, należy skorygować w dodatkowym kroku przez dodanie ujemnego mnożnika, jak 
to zrobiono na rysunku 3.44a. Korekcji rejestru R wymaga jedynie jego bardziej znacząca 
część RH. Skąd bierze się konieczność korekcji? Można zauważyć, że (n+1)-bitowa 
mnożna A w zapisie U2 może być przedstawiana jako: 


n-l ZE 

A= a,'(-27) + 24a,2' 

Stąd iloczyn dwóch liczb A i B można zapisać jako: 
nl , 

A:B=B 2 a,2' — B'a 2" 
Jeśli a, jest równe 0 (mnożna jest dodatnia), to wartość iloczynu odpowiada tylko pierw- 
szemu składnikowi tej sumy. Pierwszy składnik sumy można zrealizować stosując zwykły 
algorytm mnożenia w kodzie NKB. Jeśli natomiast a, jest równe 1 (mnożna ujemna), to 
algorytm dla kodu NKB należy uzupełnić krokiem, w którym odjęto drugi składnik tej 
sumy. W kroku tym dodaje się zatem wartość mnożnika (przesuniętego do najbardziej 


znaczącej pozycji rejestru R, co oznacza pomnożenie przez 2”) ze zmienionym znakiem. 
Ponieważ w naszym przykładzie a, = 1, to korekcja polega na dodaniu ujemnego mnożnika 
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C,RH<0 
M<—MNOŻŹNIK 
RL<—MNOŻNA 
STERN 


RLERL-M 


Rysunek 3.45. Algorytm mnożenia liczb w kodzie U2 


do zawartości rejestru RH. Zatem omawiany algorytm ma o jeden krok więcej niż wynosi 
liczba bitów, co powoduje pewne zwolnienie operacji mnożenia. Aby tego uniknąć 
wystarczy zauważyć, że odejmowanie mnożnika w ostatnim kroku można zastąpić jego 
odjęciem w kroku poprzednim, a następnie przesunięciem wyniku w prawo. Wynika to 
z faktu, że jeśli po trzecim kroku algorytmu w rejestrze R była wartość W, to w czwartym 
kroku, po dodaniu mnożnika M i przesunięciu, otrzymywaliśmy wartość 1/2(W+M). 
Następnie odejmowaliśmy M otrzymując 1/2(W-M). Zatem jeśli w trzecim kroku odjęto 
mnożnik i wynik przesunięto w prawo, to otrzymamy ten sam rezultat. Na rysunku 3.44b 
przedstawiono tak zmodyfikowany algorytm. Sieci działań obu algorytmów pokazano na 
rysunku 3.45. 
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rejestry RH RL RL M 
0000 1101 0 1110 
- 0010 
0010 1101 0 
SHR 0001 0110 1 
+ 1110 
1111 0110 
SHR 1111 1011 
- 0010 
0001 1011 
SHR 0000 1101 1 


© rm 


SHR 0000 0110 1 


Rysunek 3.46. Mnożenie liczb w kodzie U2 według algorytmu Bootha 


C, RH=0 
M<—MNOŻNIK 
RL_,—0 

RL<-MNOZNA 
STER=N 


RH<RH+M 


Rysunek 3.47. Sieć działań algorytmu Bootha 


3.2. Kody binarne i arytmetyka 5] 


Na koniec niniejszego punktu przedstawiono zmodyfikowany algorytm mnożenia 
liczb w zapisie U2, zwany algorytmem Bootha. Niech będzie dana ujemna liczba w zapi- 
sie U2. Ponadto niech k bardziej znaczących pozycji tej liczby będzie jedynkami. Wówczas 
można tę liczbę przedstawić jako: 


Aż g EA 2-1 MA 1-2 dk = 9nk+1 i 0-277k + a 21-k-1 SCE To 


n-k-| 
Przekształcając powyższe wyrażenie można otrzymać inną jego postać, a mianowicie: 


A = Akt! + a 2n-k-1 ae SE a 20 
n-k- 0 


Takie przedstawienie liczby nasunęło pomysł, że wartość dziesiętną L(A) liczby zapisanej 
w U2 można obliczyć biorąc pod uwagę zmianę wartości na sąsiednich pozycjach. I tak 
sumowanie zaczyna się biorąc ay 2° a dalej zależnie od zmian wartości bitów. Jeśli z i-tej 
na (1+1)-szą jest zmiana wartości bitów z 1 na O, to należy dodać 2'. Jeśli natomiast zmiana 
zachodzi z O na 1, to należy odjąć 2'. Podobnie podczas mnożenia istnieje możliwość 
uwzględniania w każdym kroku wartości pary bitów, a nie jednego jak w przedstawionych 
już algorytmach. Jeżeli w danym kroku dwa sąsiednie bity są jednakowe, to zawartość 
rejestru R jest tylko przesuwana. Jeżeli natomiast te dwa bity są różne, to do rejestru RH 
jest dodawana lub odejmowana wartość mnożnika w zależności od wartości tych bitów. 
Jeśli wartość bitów jest 01, to mnożnik jest dodawany, a gdy wartość bitów jest 10, to jest 
on odejmowany. Taki algorytm składa się zwykle z mniejszej liczby operacji niż przed- 
stawiony poprzednio. Na rysunku 3.46 przedstawiono stany rejestrów dla algorytmu 
Bootha, a na rysunku 3.47 jego sieć działań. W pierwszym kroku algorytmu do rejestru 
RH wpisywane są zera, a do rejestru RL mnożnik. W celu zapoczątkowania działań 
tworzy się dodatkową pozycję RL_, do której jest wpisywane zero. W naszym przykładzie 
na początku algorytmu bity kontrolne R, i RL , mają wartość 10, więc w tym kroku 
następuje odejmowanie. W drugim kroku sąsiednie bity mają wartość 01, więc następuje 
dodawanie. W trzecim wartości bitów są 10, więc ponownie nastąpi odejmowanie. 
W czwartym kroku na pozycjach R, i RL _, są dwie jedynki, więc nastąpi tylko przesuwa- 
nie. Należy zauważyć, że podczas przesuwania zawartości rejestru R jest ona uzupełniana 
w taki sposób, by nie został zmieniony znak. Oznacza to uzupełnianie zerami, gdy pamię- 
tana liczba jest dodatnia, a jedynkami, gdy liczba jest ujemna (przesuwanie arytmetyczne). 


DZIELENIE 


Operacja dzielenia dwóch liczb jest bardziej złożona od mnożenia z dwóch powodów. 
Pierwszym powodem jest to, że wynik dzielenia może nie być liczbą całkowitą i dlatego 
algorytmy dzielenia muszą uwzględniać fakt, że wynik powinien składać się z dwóch 
liczb: części całkowitej i reszty. Drugim powodem jest problem wymaganej liczby bitów 
dzielnej. Przy założeniu pożądanej długości ilorazu równego k podczas dzielenia przez 
dzielnik o długości równej m wymagana długość dzielnej powinna być m + k. 


Rozpatrzony zostanie algorytm dzielenia liczb w kodzie NKB wzorowany na dziesięt- 
nym dzieleniu „na papierze . Na rysunku 3.48 przedstawiono przykład dzielenia liczby 
+14 przez 43. Założono także, że dzielna jest 7-bitowa a dzielnik jest 4-bitowy. Zatem 
wynik dzielenia będzie 3-bitowy. W każdym kroku algorytmu dokonuje się porównania 
„aktualnej ” wartości dzielnej z dzielnikiem. Przez aktualną wartość dzielnej rozumie się 
odpowiednią część bitów (odpowiednie pozycje) dzielnej, a odpowiedniość ta zależy od 
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001110 : 0011 = 100 
0011 

00001 

0011 

000010 

0011 

000010 


Rysunek 3.48. Dziclenic dwóch liczb binarnych 


numeru kroku. W naszym przykładzie w pierwszym kroku aktualną wartość dzielnej 
stanowią 4 jej najbardziej znaczące bity. Jeżeli dzielnik jest mniejszy lub równy tej 
wartości, to do ilorazu, na odpowiednią pozycję, jest wpisywana 1 i dokonuje się 
odejmowania. Jeżeli natomiast dzielnik jest większy, to do ilorazu jest wpisywane 0 


C,RH<DZIELNA 
RL<—O0 
M£DZIELNIK 


STER=N 
a 
WĘŁ I 


0000 1110 0011 


SHL 0001 1100 


- on 
SHL 0011 1001 
- on 

0000 1001 
SHL 0001 0010 
- on 


SHL 0010 0100 


Rysunek 3.49. Algorytm dzielenia liczb w kodzie NKB 
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i uaktualnia się wartość dzielnej „spisując? następny w kolejności mniej znaczący bit. 
W pierwszym kroku naszego przykładu dzielnik był równy aktualnej dzielnej i dlatego 
jako wynik tego kroku przyjęto 1. W pozostałych dwóch krokach aktualna wartość dzielnej 
jest mniejsza od dzielnika i jako wynik kroków przyjęto 0. Wynikiem dzielenia jest liczba 
100 i reszta 000010. 


Realizacji takiego algorytmu można dokonać w układzie jak na rysunku 3.40, gdzie 
dla dzielnika przeznaczono rejestr M oraz dla dzielnej rejestr R. Ten ostatni musi być 
rejestrem przesuwającym w lewo. Zadaniem układu ALU jest tym razem porównanie 
liczb. W każdym kroku zawartość rejestru R jest przesuwana w lewo, a bit powstały 
w wyniku porównania w tym kroku jest zapisywany na najmniej znaczącą pozycję rejest- 
ru R. Po czterech krokach algorytmu w rejestrze RL znajduje się trzybitowa część całkowi- 
ta ilorazu, a w rejestrze RH jest reszta. W naszym przykładzie, w wyniku działania tego 
algorytmu otrzymamy iloraz 4 i resztę 2. Oczywiście znak ilorazu jest sumą mod 2 
znaków dzielnej i dzielnika. Stany rejestrów w kolejnych krokach pokazano na rysun- 
ku 3.49a, a sieć działań tego algorytmu pokazano na rysunku 3.49b. 


rejestr RH RL M rejestr RH RL M 
0000 1110 1100 1111 0001 0011 
SHL 0001 110%- SHL 1110 001- 
+ 1100 + 0011 
1101 0001 
0001 1100 1110 0010 
SHL 0011 10% SHL 1100 01%- 
+ 1100 + 0011 
1111 1001 1111 0101 
SHL 0001 001- SHL 0001 01i- 
+ 1100 + 0011 
1101 0001 1010 
0001 0010 1110 1010 
SHL 0010 010- SHL 1101 010- 
+ 1100 F 0011 


Rysunek 3.50. Dwa przykłady dziclenia liczb w kodzie U1 


Rozpatrzona będzie teraz operacja dzielenia w zapisie U1. Na rysunku 3.50 
przedstawiono dwa przykłady dzielenia dwóch liczb o różnych znakach (14 przez -3 oraz 
-14 przez 3). W każdym kroku algorytmu dokonuje się porównania odpowiednich bitów 
dzielnej z dzielnikiem. Porównania dokonuje się poprzez operację dodawania (w zasadzie 
jest to operacja odejmowania) ujemnego dzielnika i kontrolę znaku wyniku. Jeżeli wynik 
ma znak dzielnej, to jego wartość pozostaje w rejestrze, a na najmniej znaczącą pozycję 
rejestru R zapisuje się 1. Jeżeli wynik ma znak dzielnika, to przywraca się poprzednią 
zawartość rejestru R, a na najmniej znaczącą pozycję rejestru R zapisuje się 0. Po drugim 
kroku dzielenia +14 przez -3 w wyniku porównania otrzymano 1111. Ponieważ jest to zero 
w zapisie Ul, to wynik ma znak dzielnej i na najmniej znaczącą pozycję wpisano 1. Do 
dalszych kroków algorytmu przywrócono zawartość rejestru R na 0000, a po przesunięciu 
na 0001. 
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rejestr RH RL M rejestr RH RL M 
1111 0010 0011 0000 1110 1101 
SHL 1110 010- SHL 0001 110- 
+ 0011 + 1101 
0001 1110 
1110 0100 0001 1100 
SHL 1100 100- SHL 0011 100- 
+ 0011 + 1101 
1111 1001 0000 1001 
SHL 1111 001- SHL 0001 001- 
į 0011 + 1101 
0010 1110 
1111 0010 0001 0010 
SHL 1110 010- SHL 0010 010- 
+ 0011 + 1101 
0001 1111 
1110 0100 0010 0100 


Rysunek 3.51. Operacja dzielenia w kodzie U2 
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Rysunek 3.52. Algorytm dzielenia liczb w kodach U1 i U2 
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Z aaa 


Można zauważyć, że dla obu przedstawionych przypadków wyniki są różne. Przyczyną 
tego stanu rzeczy jest definicja reszty. W tych działaniach zdefiniowano resztę jako 
R=D- IM, gdzie R jest resztą, D dzielną, I ilorazem, a M dzielnikiem. W obu przypad- 
kach iloraz I = -4. W pierwszym przypadku, gdy D = +14, a M = -3, to reszta wynosi 
R=2. W drugim przypadku, gdy D = -14, a M = +3, to reszta wynosi R = —2. 


W zapisie U2 algorytm dzielenia jest podobny do przedstawionego. Na rysunku 3.51 
pokazano stany rejestrów podczas operacji dzielenia na przykładzie dzielenia liczby -14 
przez +3 oraz +14 przez -3. Podobnie jak w przypadku zapisu U1, tak i w tym przypadku 
otrzymano różne postacie wyników. 


Na rysunku 3.52 pokazano sieć działań algorytmu dzielenia w zapisach U1 i U2. 
Układ do realizacji dzielenia powinien być wyposażony w dodatkowy rejestr dla pamię- 
tania zawartości rejestru RH. Jeżeli tak nie jest, to każdy krok musi zawierać dodatkową 
jedną operację dodawania celem przywrócenia poprzedniej zawartości rejestru RH. 


3.2.4. ZMIENNOPOZYCYJNA REPREZENTACJA LICZB 


Przedstawione w poprzednich podrozdziałach zapisy liczb i operacje arytmetyczne 
dotyczyły liczb całkowitych. Celem uzyskania reprezentacji liczb ułamkowych, a także 
zwiększenia zakresu liczb i dokładności obliczeń, wprowadzono w komputerach tzw. 
zapis zmiennopozycyjny. Binarny zapis tych liczby składa się z trzech części, z których 
każda kodowana jest na oddzielnych polach: 

—  jednobitowe pole znaku (ang. sign) 

— n-bitowe pole części ułamkowej inaczej zwanej mantysą S (ang. significand part), 

— m-bitowe pole części wykładnika inaczej zwanego cechą E (ang. exponent part). 


Można zatem każdą liczbę A przedstawić jako +S-B*™, gdzie B jest przyjętą podstawą dla 
wykładnika. Jako podstawę przyjmuje się najczęściej albo 2, albo 10, albo 16. Część 
ułamkowa jest zawsze z przedziału [0.5, 1.0), co dwójkowo można zapisać jako: 


0.100...0 < S < 0.111...1 


Można zauważyć, że pierwsze dwie pozycje mantysy są zawsze takie same. Dlatego 
biorąc n-bitową część ułamkową a >A...A_„,) W rzeczywistości przedstawia się liczbę 


= axel 922 „9-3 „y-(n+2) 
0.la „a ;...8 (> U. MZ Pas X Pa4 2 Rze A_(n+2) 2 


Wartość wykładnika jest liczbą całkowitą, która może być dodatnia, gdy przedstawiana 
liczba jest większa od 1, i ujemna, gdy przedstawiana liczba jest mniejsza od 1. Dla 
reprezentacji wykładnika można używać poznanych wcześniej zapisów liczb. Najczęściej 
stosowany bywa zapis polaryzowany. Projektanci systemów stosując zapisy liczb zmienno- 


Tablica 3.11. Przykładowe długości cechy i mantysy 


Komputer Słowo Znak Cecha Mantysa 
NO PZ ZOZ ZZA RÓ Z O E E ET AZ DA AŚ ZA 
VAX 11 32 l 23 8 
Mikroprocesor Intel 80 l 64 15 
Standard IEEE 754 64(32) l 48(23) 45(8) 
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pozycyjnych dążą do standaryzacji długości mantysy 1 wykładnika. Choć w różnych 
komputerach wartości te są różne, to jednak dążenia te doprowadziły do przyjęcia norm. 
W tablicy 3.11 zestawiono niektóre standardy. 


Załóżmy 32-bitowe słowo ze standardu IEEE 754. Niech mantysa będzie 23-bitowa, 
a cecha 8-bitowa. Dla takiego słowa wyznaczmy zakres reprezentowanych liczb. Najmniej- 
sza liczba wynosi 0.5:2 '**, a największa (1-279)2''77, Na rysunku 3.53 porównano grafi- 
cznie zakresy reprezentacji liczb w zapisie U2 i w zapisie zmiennopozycyjnym dla 32- 
bitowych słów. Z tego wykresu widać, że znacznie większy zakres ma zapis 
zmiennopozycyjny. Natomiast rozdzielczość (różnica pomiędzy sąsiednimi liczbami w 
danym zapisie) jest PR dla zapisu U2, gdyż wynosi 2 >l natomiast dla zapisu 
zmiennopozycyjnego 2”. Tę niedogodność zapisu zmiennopozycyjnego usuwa się 
przyjmując dwa formaty A Jeden dla standardowej dokładności (np. 32 bity) i drugi 
dla podwójnej dokładności (np. 64 bity). Jak widać z rysunku 3.53 zakres prezentowanych 
liczb zmiennopozycyjnyh nie obejmuje liczb bardzo bliskich O, tj. znajdujących się w 
środku wykresu. 


23! | +231 


Oo —— —— 


-(1 -224). 2127 -0.5-2 128 +0.5. 9-128 (1 -224). 2127 


Rysunek 3.53. Zakresy 32-bitowych liczb w zapisie U2 i zmiennopozycyjnym 


Celem ilustracji tych rozważań przedstawiono dalej konwersję liczb stałopozycyjnych 
i zmiennopozycyjnych. Niech będzie dana liczba +625.625 w zapisie zmiennopozycyjnym 
z 23-bitową mantysą i 8-bitową cechą. Pierwszą czynnością podczas poszukiwania jej 
postaci zmiennopozycyjnej jest normalizacja liczby, czyli przedstawienie jej w postaci: 


+0.1a_„a „aa 


spd 


—25 


W zapisie dziesiętnym będzie to liczba 0.625625-10. Zamiany na liczbę dwójkową 
można dokonać przez przedstawienie osobno części całkowitej, tj. 625 i części ułamkowej, 
tj. 0.625. Liczbę 625 da się przedstawić na 10 bitach jako 1001110001. Natomiast 
0.625 można przedstawić jako 0.5+0.125, tj. 0.101. W rezultacie otrzymano liczbę 
1001110001.101. Normalizując tę liczbę, tj. przesuwając ją o 10 pozycji w prawo, otrzyma 
się 0.1001110001101-2'. W ten sposób powstała* zmiennopozycyjna reprezentacja tej 
liczby: 

bit znaku mantysa cecha 


0 0011 1000 1101 0000 0000 000 10001010 
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Bit znaku jest zerem, ponieważ liczba jest dodatnia. Mantysa jest 23-bitowa, lecz 
należy pamiętać, że normalizując pominięto pierwsze bity (0.1). Cechę przedstawiono 
w zapisie polaryzowanym i jej wartość dziesiętna wynosi 10. 


Na koniec warto zwrócić uwagę na algorytm zamiany części ułamkowej liczby na 
postać dwójkową. Wcześniej dokonano tego zauważając, że liczba 0.625 daje się przed- 
stawić jako 0.101. W ogólnym przypadku zadanie może być trudniejsze i wówczas należy 
znormalizować liczbę dziesiętną do odpowiedniego zakresu. W naszym przypadku mamy, 
że 512 < 625 < 1024. Dzieląc zadaną liczbę przez 1024 otrzyma się 0.610961914...-2'. 
Przekształcenia mantysy M na postać dwójkową można dokonać w sposób następujący: 


1) i=l; | 
2) CzyM22?? Jeżeli tak, to M =M-2'; jeżeli nie, to M = M; 
3) i1=1i+1; 


4) Czyi=23? Jeżeli nie, to punkt 2; jeżeli tak, to KONIEC. 


3.2.5. ARYTMETYKA ZMIENNOPOZYCYJNA 


W niniejszym podrozdziale przedstawiono cztery działania arytmetyczne na liczbach 
zmiennopozycyjnych. Pokazano je na przykładach, w których posłużono się prostymi 
liczbami, tj. liczbami o niewielkiej długości zarówno cechy jak i mantysy, po to aby 
Czytelnik łatwiej mógł prześledzić tok działań. 


Operacje dodawania i odejmowania w tym zapisie wymagają procedury wyrównania 
wykładników. Procedura ta jest wykonywana w taki sposób, że mantysa liczby mniejszej 
(o mniejszym wykładniku) jest zmniejszana. Zmniejszania mantysy dokonuje się poprzez 
przesuwanie w prawo. Pomniejszanie mantysy powoduje, że należy zwiększać jej wy- 
kładnik. Podczas jednokrotnego przesunięcia mantysy należy zwiększyć wykładnik o 1, 
jeżeli baza wykładnika wynosi 2. Procedura kończy się w momencie wyrównania wykład- 
ników. Pokazano to na przykładzie. 


Niech będą dane dwie liczby A = S,:27%* i B = S,-27?. Załóżmy, że EA < EB. 
Wyrównanie polega na przesunięciu mantysy S a (EB - EA) razy. Wówczas 


A a- (Suae = PA $ (EA + (EB — EA)) i (Sy (EA = EB)) : JEB 


Dopiero po wyrównaniu można dokonać operacji dodania lub odjęcia liczb biorąc: 


Należy zauważyć, że w ogólnym przypadku tak otrzymana mantysa nie jest znormalizo- 
wana. Dlatego po operacji dodawania lub odejmowania należy znormalizować mantysę 
wyniku i odpowiednio do tego zmienić wartość wykładnika. Sama operacja dodawania 
może spowodować zwiększenie wykładnika o 1, gdyż przeniesienie może być tylko na 
następną pozycję. 


Dodawanie i odejmowanie dwóch liczb z 8-bitową mantysą i 4-bitową cechą pokazano 
na przykładzie: 


A — 0 00101001 1101 
B — 0 00011010 1010 


5 — Podstawy budowy i działania komputerów 
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Kolejne kroki algorytmu są następujące: 
1) Porównanie wykładników EA =5 i EB = 2 wskazuje na konieczność przesunięcia 
mantysy liczby B o 3 pozycje w prawo. 
2) Wyrównanie wykładników S,=0.100101001 S„:2%*-7%= 0.000100011. 
3) Obliczenie sumy A+B O 01001100 1101. 


Sprawdzając operację na liczbach dziesiętnych otrzymać można: 
A=(2'+24+2%+2°)-25=24+2!+27!+274= 18.5625 
B=(2'+2”+2+29):27=2'+2*+2*+20=2.203125 
A+B=(2'+2*+27+2):27=2+27+2'1+2*= 20.75 


Sprawdzenie nie potwierdziło prawidłowości obliczeń, gdyż wynik dodawania dziesiętnego 
(20.765625) różni się od obliczonego o 0.015625. Fakt ten staje się oczywisty, gdy 
weźmie się pod uwagę jedynki liczby normalizowanej, które usunięto przy przesuwaniu. 
W naszym przykładzie usunięto jedynkę o wadze 2 * i ona właśnie spowodowała błąd o 
28.2? = 7% = 0.015625. 


Dla algorytmu odejmowania w zapisie zmiennopozycyjnym dwa pierwsze punkty 
algorytmu są takie same jak dla dodawania. Mantysa różnicy A — B = 0.100000110, więc 
normalizacja nie jest potrzebna i otrzymujemy: 

(A-B) 0 00000110 1101 
co dziesiętnie wynosi 0.511718752 = 16.375. Natomiast sprawdzając algorytm i odejmu- 
jąc liczby dziesiętne otrzyma się, że A — B = 16.359375. Powstały błąd jest tej samej 
natury co poprzednio, a mianowicie błąd wynikający z usunięcia bitów przy przesuwaniu. 


Mnożenie i dzielenie liczb ziennopozycyjnych jest proste i wynika z poniższych 
wzorów: 
A-B= (S, 2 


A:B=(S,: S„)-2* 7) 


Stosując zapis polaryzowany dla wykładników należy pamiętać, że operacje na nich 
wymagają odpowiednich korekt. Po dodaniu dwóch wykładników (podczas mnożenia) 
należy odjąć współczynnik polaryzacji (100...0). Natomiast po odejmowaniu (podczas 
dzielenia) trzeba go dodać. Niezależnie od tej czynności należy w obu przypadkach 
dokonać normalizacji. 


Dla przykładu pomnożono te same liczby co poprzednio: 

1) Sa S= 0.010100011100101010 i po zaokrągleniu oraz normalizacji: 
SĄ.g =0.101000111-2". 

2) Cecha wynosi (1101 + 1010) - 1000 = 10111 - 1000 = 1111. 

3) Iloczyn A-B O 01000111 1110. 


Dziesiętnie jest to 0.638671875 -26 = 40.875, podczas gdy mnożenie dziesiętne daje wynik 
40.8955078125. Błąd zaokrąglenia wynosi w tym przypadku 


(21 + 21 + 2172 = 2 + 28 + 2’ = 0.0205078125. 


Dzielenie liczb A przez B zachodzi według schematu: 
1) SĄ: S= 1.000011010 co po normalizacji wynosi S,.„ = 0.100001101-2!. 
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2) Cecha wynosi (1101 - 1010) + 1000 = 0011 + 1000 = 1011 oraz po dodaniu 2! 
czyli 1011. 
3) IlorazA : B 0 00001101 1100. 


Przedstawiając tę liczbę dziesiętnie otrzymamy 0.52342752* = 8.375. Natomiast dzieląc 
18.5625 przez 2.203125 otrzymamy 8.425531915. Różnica powstała przy dzieleniu man- 
tys, które było robione w 9 krokach. Zarówno dzielna jak i dzielnik były 9-bitowe. Gdyby 
obliczyć iloraz z większą dokładnością, to wynik mógłby być także bardziej dokładny. 
Dodanie jeszcze jednej, najmniej znaczącej jedynki, spowodowałoby wzrost ilorazu do 
8.4375, a więc byłby on większy od właściwego. 


Jak wynika z podanych przykładów istotnym problemem jest problem dokładności. 
Aby ją zwiększyć stosuje się tzw. bity ochrony (ang. guard bits). Celowość ich użycia 
wyjaśnia przykład: 


Niech będą dane dwie liczby dziesiętne A=+1 i B= +(1 — 2), które w reprezentacji 
zmiennopozycyjnej mają postać: 

l 0 00000000 1001 

1-27 O 11111111 1000 
Algorytm odejmowania nakazuje wyrównanie wykładników, co daje: 

A 0.100000000 1001 


B 0.011111111 1001 
i wtedy różnica 
A-B 0.000000001 1001 


co po normalizacji daje liczbę 0.100000000 -27 = 2778. 


Stosując bity ochrony (przed operacją są one zerowane) otrzyma się: 


A 0.100000000 000 1001 

B 0.111111111 000 1000 
Po wyrównaniu wykładników 

A 0.100000000 000 1001 

B | 0.011111111 100 1001 
i wówczas różnica 

A-B 0.000000000 100 1001 


co po normalizacji daje liczbę 0.100000000-2*= 27. Otrzymano teraz inny wynik niż 
poprzednio, ale jak można zauważyć ten ostatni wynik jest poprawny. 


Innym problemem rzutującym na dokładność jest problem zaokrąglania. Aby poprawić 
dokładność stosowane są dwie techniki: 
— odrzucanie (ang. truncation), polegające na ignorowaniu najmniej znaczących 
bitów nie wchodzących do zapisu, 
— _ zaokrąglanie (ang. rounding) polegające na dodaniu jedynki w przypadku, gdy 
najbardziej znaczący z odrzucanych bitów jest jedynką. Jeśli jest on zerem, to 
wykonuje się odrzucanie. 


Odrzucanie jest więc zaokrąglaniem w dół, podczas gdy zaokrąglanie jest zawsze w 
górę. 


PROCESORY 


4.1. ORGANIZACJA PROCESORA 


Procesor stanowi najistotniejszy blok komputera i jego parametry decydują o parametrach 
komputera. Różne komputery często mają podobne pamięci i podobne urządzenia ze- 
wnętrzne, ale zwykle różnią się procesorami. Szybkość działania komputera najsilniej 
zależy od szybkości działania procesora, moc obliczeniowa komputera najsilniej zależy od 
mocy obliczeniowej procesora itd. Każdy program przechowywany w pamięci jest od- 
czytywany przez procesor, on dekoduje kod rozkazu, pobiera odpowiednie argumenty dla 
danej operacji, wykonuje tę operację i przesyła wynik operacji w odpowiednie miejsce. 
Niezależnie od wykonywanego programu zadanego przez operatora procesor wykonuje 
także równolegle pewne stałe programy. służące koordynacji pracy procesora z innymi 
blokami, czyli steruje pracą całego komputera. Przykładowo procesor jest odpowiedzialny 
za wyznaczenie kolejności działania urządzeń zewnętrznych, za postać informacji zapisy- 
wanej do pamięci dyskowej czy do monitora, za poprawne reakcje na różne błędy itp. 
Wszystkie te czynności realizuje procesor wykonując program stale rezydujący w pamięci, 
zwany systemem operacyjnym (por. rozdz. 7). 


Architektura klasycznego komputera zaproponowana przez von Neumana opierała się 

na trzech kluczowych założeniach: 

l) program wykonywany przez procesor, wraz z danymi dla programu 
(argumentami), jest umieszczony w pamięci; 

2) kolejność wykonywanych rozkazów zależy od ich umieszczenia w programie 
(kolejne rozkazy są umieszczane w kolejnych komórkach pamięci), a zmiana tej 
zasady może być dokonana tylko przez sam program (rozkaz skoku); 

3) procesor odczytuje kolejne rozkazy z pamięci wysyłając odpowiednie adresy. 


Program umieszcza się w pamięci wczytując go, z odpowiednich nośników (np. dyskietki), 
za pomocą odpowiednich urządzeń wejściowych. Takimi typowymi urządzeniami 
przeznaczonymi do tego celu są: 
1) klawiatura w przypadku pracy interakcyjnej, tzn. gdy operator na bieżąco 
współpracuje z komputerem; 
2) napęd dysku elastycznego, gdy operator wcześniej przygotował program 1 dane na 
dyskietce, a w odpowiednim momencie przepisuje je do pamięci komputera. 


Po zapisaniu programu do pamięci może on zostać wywołany do wykonania w dowolnym 
momencie. Wywołanie programu następuje w momencie, gdy procesor wyśle do pamięci 
adres komórki, w której zapisano pierwszy rozkaz programu. Wówczas kod tego rozkazu 
zostaje umieszczony w rejestrze rozkazów procesora. Ponieważ kolejne rozkazy są w kolej- 
nych komórkach pamięci, to zaraz po odczytaniu jednego rozkazu procesor przygotowuje 
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do wysłania do pamięci adres następnego rozkazu. Celem łatwej realizacji tego zadania 
w procesorach stosuje się licznik (na rys. 2.2 oznaczono go symbolem LR) nazywany 
zwykle licznikiem rozkazów PC (ang. program counter). Przygotowanie następnego adresu 
polega wówczas na dokonaniu inkrementacji zawartości tego licznika. 


Istnieją jednak trzy przypadki, kiedy procesor zmienia kolejność wykonywania rozka- 
zów. Pierwszym z nich jest przypadek, gdy sam rozkaz umieszczony w programie zmienia 
tę kolejność. Jest to rozkaz skoku wraz z adresem skoku do określonego miejsca pamięci. 
W takim przypadku adresem następnego rozkazu nie będzie zawartość licznika rozkazów 
zwiększona o 1, ale adres skoku. Następuje wtedy załadowanie nową wartością licznika 
rozkazów PC lub innego rejestru (rejestru adresowego AD na rys. 4.1). Jeśli wykonanie 
rozkazu skoku zależy od spełnienia jakiegoś warunku, to mówi się, że skok jest warun- 
kowy. Wykonanie takiego rozkazu odpowiada realizacji rozgałęzień w algorytmie opisują- 
cym ten program. 


Drugim przypadkiem zmiany wykonywania ciągu rozkazów jest zażądanie przełącze- 
nia się procesora i wykonania programu wskazanego przez system operacyjny. Może to 
wynikać z analizy dotychczasowej pracy procesora, jak np. wykrycie błędu. W takim 
przypadku system operacyjny, po rozpoznaniu rodzaju błędu, wywołuje program reakcji 
na dany błąd (korekcja błędu, poinformowanie operatora, zatrzymanie akcji itp.) ustawiając 
odpowiednie zawartości w rejestrze PC (lub AD). 


Trzecim przypadkiem zmiany kolejności wykonywania rozkazów jest reakcja proceso- 
ra na przychodzące z zewnątrz sygnały. Zwykle procesor jest wyposażony w odpowiednie 
wejścia, na których pojawiają się sygnały informujące procesor o pewnych zdarzeniach. 
Zdarzeniem takim może być przykładowo żądanie przez operatora inicjalizacji pracy 
komputera (reset) lub wykonywanie rozkazów „krok po kroku (praca krokowa) wraz 
z analizą stanu procesora. I w takim przypadku odpowiednie układy powodują ustawienie 
nowej zawartości w rejestrze PC (lub AD). 
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Na rysunku 4.1 pokazano uproszczoną strukturę klasycznego procesora. Składa się on 
z trzech podstawowych podzespołów: bloku rejestrów, bloku arytmetyczno-logicznego 
i układu sterującego przebiegiem pracy. Blok rejestrów zawiera rejestry ogólnego przezna- 
czenia, tj. takie, które operator może dowolnie wykorzystywać, jak np. rejestr operacyjny 
(akumulator). Jak już wcześniej powiedziano w różnych komputerach może być różna 
ich liczba. W popularnym komputerze IBM PC jest ich 8 (8-bitowych). Jak widać na 
rysunku 4.1 w skład tego bloku nie zaliczono rejestrów specjalnego przeznaczenia. Są to: 

— rejestr rozkazów, do którego zapisywany jest kod operacji, którą ma wykonać 

procesor, 
— licznik rozkazów PC wraz z rejestrem AD adresującym pamięć, 
— rejestr znaczników (por. dalsza część opisu). 


Blok procesora nazywany będzie dalej blokiem CPU (ang. central processor unit). Przesła- 
nia informacji pomiędzy blokami procesora odbywają się poprzez połączenia, które tworzą 
tzw. magistralę (ang. bus) lub inaczej szynę. Taka struktura pozwala na jednoczesne 
przesłanie informacji tylko pomiędzy dwoma blokami. Na przykład jeśli wynik z wyjścia 
błoku ALU jest przesyłany do rejestrów, to w tym czasie nie można zapisywać lub 
odczytywać rejestrów RR lub PC. Przesłania pomiędzy różnymi blokami zachodzą 
sekwencyjnie. Za ich kolejność odpowiada układ sterowania. Należy tu zaznaczyć, że 
stosowane są także inne, niż magistrala, struktury połączeń, które umożliwiają jedno- 
czesne przesłania pomiędzy wieloma blokami. Problem ten przedstawiono nieco szerzej 
w rozdz. 8. 


magistrala 
systemowa komputera 


Rysunek 4.2. Schemat blokowy komputera 


Podobnie połączenia procesora z pamięcią i z urządzeniami zewnętrznymi (rys. 4.2) 
mogą być realizowane przez magistralę. Jest to najczęściej spotykany sposób połączeń 
wewnątrz jednoprocesorowego komputera. W magistrali komputera można wyróżnić trzy 
grupy linii: 

— linie danych tworzące tzw. szynę danych, 

— linie adresowe tworzące tzw. szynę adresową, 

— linie sterujące tworzące tzw. szynę sterującą. 


Liczba linii każdej grupy jest różna w różnych komputerach. Liczba linii szyny danych 
jest na ogół równa długości słowa danego procesora (ewentualnie uzupełniona o bity 
detekcji lub korekcji błędów). W mikrokomputerach i minikomputerach wynosi ona 8 lub 
16, w większych komputerach jest wielokrotnością tych liczb. Liczba linii szyny adresowej 
zależy od pojemności pamięci współpracującej z danym procesorem i zwykle waha się 
pomiędzy 20 a 32. Wielkość ta wyznacza rozmiar licznika rozkazów i rejestru adresowego 
pamięci. Jeśli liczba linii szyny adresowej wynosi 20, to można zaadresować 2°? (nieco 
więcej niż milion) komórek pamięci. Liczba linii szyny sterującej to kilkanaście, a czasem 
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kilkadziesiąt linii, którymi przesyłane są m.in. sygnały strobów odczytu i zapisu, a także 
inne sygnały, o których będzie mowa w dalszym ciągu. 


Na rysunku 4.1 pokazano 4 linie przeznaczone dla sygnałów strobów: dwie dla pa- 
mięci (MR — odczyt pamięci i MW — zapis pamięci) i dwie dla urządzeń zewnętrznych 
(IOR — odczyt urządzenia i IOW — zapis urządzenia). Ponadto pokazano 4 wejściowe 
sygnały sterujące przychodzące do procesora z innych zespołów komputera. Są to RESET 
(sygnał inicjalizacji pracy procesora, ustawiający adres pierwszego rozkazu programu), 
STEP (sygnał pracy krokowej, tj. wykonywania programu rozkaz po rozkazie), INT 
(sygnał przerwania wykonywania programu celem wykonania przez procesor np. pro- 
gramu zleconego przez system operacyjny) i HOLD (sygnał wstrzymania pracy procesora 
generowany przez inne urządzenia dla wykonania transmisji pomiędzy tymi urządzeniami 
bez ingerencji procesora). Układ sterowania generuje także dwa wyjściowe sygnały steru- 
jące. Jeden jest sygnałem potwierdzającym przerwanie wykonywania programu przez 
procesor (INTA — ang. interrupt acknowledge) a drugi sygnałem potwierdzającym 
wstrzymanie pracy procesora (HLDA — ang. hold acknowledge). 


Załóżmy teraz, że w jakimś momencie w rejestrze adresowym AD znajduje się adres 
aktualnie pobieranego rozkazu (zakładamy, że adres ten znajdzie się na szynie adresowej) 
i układ sterowania równocześnie wyśle strob odczytu z pamięci MR. Po pewnym czasie, 
zwanym czasem dostępu do pamięci (por. rozdz. 5), zawartość danej komórki pamięci 
zostanie wysłana do procesora i zostanie umieszczona w rejestrze rozkazów. Układ stero- 
wania procesorem zdekoduje zawartość tego rejestru i na tej podstawie zadecyduje o dal- 
szej akcji procesora wysyłając odpowiednie sygnały, np. sygnał inkrementacji licznika 
rozkazów celem pobrania argumentu danej operacji. Są rozkazy, które wykonywane są 
warunkowo. Warunkami tych rozkazów jest najczęściej stan rejestru znaczników ZN 
(ang. flag register). Na rysunku 4.1 widać, że zawartość tego rejestru jest ustawiana przez 
układ ALU. Znacznikami są pewne cechy wyniku operacji wykonywanych przez ALU. 
Mogą to być takie cechy jak np.: 

— wynik równy zeru — znacznik Z, 

— wynik z parzystą liczbą jedynek — znacznik P, 

— wynik z przeniesieniem — znacznik C, 

— wynik z nadmiarem — znacznik O, 

— znak wyniku — znacznik S. 


Programista może zatem uzależnić działanie swojego programu od wyników pośrednich, 
używając znaczników jako warunków dla rozkazów skoków warunkowych. W ten sposób 
uzyskać można rozgałęzienia w programach. 


„Argumenty operacji wykonywanych przez ALU mogą pochodzić z trzech źródeł: 
1) programu, 

2) rejestrów procesora, 

3) komórek pamięci. 


Kod operacyjny rozkazu musi specyfikować miejsce odczytu argumentów dla danej operac- 
ji. Jeśli argument znajduje się w programie, to zwykle jest to następne słowo w kodzie 
programu i dlatego znajduje się w następnej, po kodzie operacyjnym rozkazu, komórce 
pamięci. Wówczas układ sterowania ma za zadanie spowodowanie odczytania tego słowa, 
co wykonuje przez zwiększenie licznika rozkazów o 1. W komputerach operujących 
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długimi słowami można zarówno kod operacyjny, jak i argument, umieścić w jednym 
słowie. W takim przypadku układ sterowania ma za zadanie tylko rozróżnienie właściwych 
pozycji tego słowa. W komputerach operujących bardzo krótkimi słowami, np. 8-bitowymi, 
zarówno długość słowa kodu operacyjnego, jak i argumentu może przekraczać długość 
słowa komputerowego. Wówczas zadaniem układu sterowania jest przeprowadzenie wielo- 
krotnego odczytu pamięci i skompletowanie zarówno rozkazu, jak i argumentu. 


Jeśli argument znajduje się w rejestrach, to zaledwie kilka bitów wystarczy, aby 
wskazać odpowiedni rejestr. Jeśli przykładowo rejestrów jest 16, to do wskazania numeru 
rejestru wystarczą 4 bity i często kod operacyjny zawiera już ten numer. Rozkazy takie 
mogą mieć niewielką długość. 


Jeśli argument jest w pamięci, to jego adres może znajdować się w: 
1) kodzie programu, 

2) rejestrze procesora, 

3) pamięci. 


Jeśli adres argumentu znajduje się w kodzie programu, to układ sterowania wymusza 
odczytywanie następnego słowa (lub następnych słów) z pamięci i umieszcza je w rejestrze 
adresowym, aby umożliwić odczyt samego argumentu. Jeśli adres argumentu znajduje się 
rejestrze, to układ sterowania musi umożliwić przepisanie zawartości tego rejestru do 
rejestru adresowego. Jeśli adres argumentu jest w pamięci, to procesor musi najpierw 
dokonać odczytu komórek pamięci, w których znajduje się adres, a następnie umieścić go 
w rejestrze adresowym i dokonać odczytu samego argumentu. - 


W rzeczywistości jest jeszcze więcej sposobów wykonania danego rozkazu, a szcze- 
gólnie adresowania argumentów operacji. Sposoby te dokładniej przedstawiono w pod- 
rozdz. 4.7. Tutaj należy zauważyć, że w zależności od miejsca, gdzie znajdują się argu- 
menty rozkazu, czas jego wykonania będzie różny. Najszybciej wykonywane są rozkazy 
z argumentami w rejestrach, gdyż czas pobrania argumentu jest najkrótszy. Po odczytaniu 
rozkazu nie trzeba sięgać do pamięci celem odczytania argumentów. Jeśli argument znaj- 
duje się w programie, to znaczy, że wraz z odczytaniem rozkazu z kodu programu 
procesor musi odczytać stamtąd argument. Jeśli słowo maszynowe (słowo komputerowe) 
jest dostatecznie długie, to argument może być odczytywany jednocześnie z kodem rozka- 
zowym. Natomiast jeśli jest ono krótkie, jak w przypadku mikrokomputerów, to argument 
jest zwykle zapisany w następnej (lub następnych), po kodzie rozkazu, komórce pamięci. 
Taki rozkaz będzie wykonywany dłużej, gdyż wymaga dwóch (lub więcej) dostępów do 
pamięci. 


Jeśli argument znajduje się w komórce pamięci, to rozkaz wymaga różnej liczby 
dostępów do pamięci w zależności od tego, gdzie znajduje się adres argumentu. Jeśli adres 
jest w rejestrze, to czas wykonania rozkazu będzie krótszy niż w przypadku, gdy ad- 
res znajduje się w kodzie programu. W tym drugim przypadku najpierw trzeba odczytać 
adres a dopiero potem argument. Najdłużej trwa zwykle wykonanie rozkazu z argumentem 
w pamięci, gdy jego adres też znajduje się w pamięci. W takim przypadku potrzebne są 
cykle dostępu do pamięci dla odczytania adresu, a następnie cykl odczytania samego 
argumentu. Jak widać z opisu czas trwania wykonania pojedynczego rozkazu zależy od 
zastosowanego trybu adresowania. W następnym podrozdziale przedstawiono różne cykle 
wykonania rozkazów. 
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4.2. CYKL ROZKAZOWY PROCESORA 


Czas potrzebny na odczytanie kodu operacyjnego rozkazu z pamięci, na pobranie 
argumentów, na wykonanie rozkazu i przesłanie wyniku operacji nazywa się cyklem 
rozkazowym lub cyklem instrukcyjnym. Składa się on z kilku faz zwanych cyklami 
maszynowymi, których liczba odpowiada liczbie dostępów do pamięci. Pierwszy cykl 
maszynowy w każdym cyklu rozkazowym to cykl pobrania kodu rozkazu (ang. fetch). 
Jeżeli argumenty rozkazu znajdują się w rejestrach procesora, to wykonanie operacji 
zakodowanej w tym rozkazie może nastąpić bezpośrednio po jego pobraniu, czyli w tym 
samym cyklu maszynowym. Jeśli jednak argumenty tego rozkazu znajdują się w kodzie 
programu lub w pamięci, to następne cykle maszynowe będą cyklami odczytu pamięci 
(ang. memory read). 


Do tej pory mówiliśmy jedynie o argumentach operacji nie wspominając o jej wyniku. 
Natomiast rozkaz powinien specyfikować także miejsce przesłania wyniku operacji. Może 
on zostać zapisany do jakiegoś rejestru procesora i wówczas nie jest wymagany osobny 
cykl maszynowy dla tej operacji. Ale może też zajść przypadek wymagający przesłania 
wyniku do pamięci. Wtedy rozkaz musi określać adres tego miejsca. Podobnie jak dla 
argumentów, adres przeznaczenia może znajdować się w rejestrze, w kodzie programu 
lub w pamięci. Układ sterowania zapewni, że ostatnim cyklem maszynowym takiego 
cyklu rozkazowego będzie cykl zapisu do pamięci (ang. memory write). Argumenty 
operacji i wynik operacji nazywane są często operandami danej operacji. Mówi się o 
operandach źródłowych (argumentach) i operandach przeznaczenia (wynikach). 


Na rysunku 4.3 przedstawiono graficznie kolejne fazy cyklu rozkazowego. Na dwóch 
poziomach zaznaczono fazy zaangażowania procesora (dolny poziom oznaczony CPU) 
i pamięci (górny poziom oznaczony PAM). Pokazany na rysunku przykładowy cykl instruk- 
cyjny składa się z 4 faz: 

l) fazy pobrania rozkazu, 

2)13) dwóch faz pobrania argumentów rozkazu, 

4) fazy zapisu wyniku do pamięci. 
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Rysunek 4.3. Cykl rozkazowy procesora 
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Czas trwania fazy pobrania rozkazu zależy od rodzaju procesora i rodzaju rozkazu. 
Jeśli procesor jest 8-bitowy (mikroprocesor) i rozkaz zawiera 8-bitowy kod operacyjny 
rozkazu i 16-bitowy adres argumentu, to faza pobrania rozkazu składa się z 3 cykli 
maszynowych odczytu pamięci. Pierwszy cykl jest cyklem odczytu kodu operacyjnego 
(faza pobrania rozkazu), drugi jest cyklem odczytu jednego bajtu adresu i trzeci jest 
odczytem drugiego bajtu adresu. Jeśli procesor (i rozkaz) jest 32-bitowy, to zarówno kod 
operacyjny, jak i adres argumentu można odczytać z pamięci w jednym cyklu maszyno- 
wym. Pobranie argumentu może być zatem jednocyklowe lub wielocyklowe. Często argu- 
ment ma długość równą długości słowa w pamięci i wówczas pobranie odbywa się 
w jednym cyklu. Ale czasem można spotkać argumenty o znacznej długości. Na przykład 
w 16-bitowych mikrokomputerach stosowane są nawet 80-bitowe argumenty (argumenty 
operacji zmiennopozycyjnych). Argument o takiej długości, w mikroprocesorach 16- 
-bitowych, jest pobierany w 5 cyklach odczytu pamięci. 


Aby zilustrować podany opis rozpatrzono sposób wykonania programu dodawania 
dwóch stałopozycyjnych liczb 16-bitowych w komputerze 16-bitowym. Kod rozkazowy 
ma długość 12 bitów, a adres jest 20-bitowy. Założono, że komórka pamięci zawiera 16 bi- 
tów. Pozwala to na umieszczenie zarówno kodu rozkazowego, jak 1 adresu w 2 komórkach 
pamięci (razem 32 bity). Założono ponadto, że: 

— adres pierwszego rozkazu programu wynosi 300, 

— argumenty operacji znajdują się w komórkach pamięci o numerach ADRI1 = 841 

i ADR2=915, 
— wynik operacji ma znaleźć się w komórce pamięci o adresie ADR2. 


Na rysunku 4.4a pokazano ułożenie programu w pamięci, czyli tzw. mapę pamięci. 
Program składa się z 4 rozkazów: 

— rozkazu odczytu pierwszego argumentu i zapisania go do rejestru A, 

— rozkazu odczytu drugiego argumentu i zapisania go do rejestru B, 

— rozkazu dodania obu argumentów, 

— rozkazu przesłania wyniku do pamięci. 
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Rysunek 4.4. Mapa pamięci (a) i zawartości rejestrów procesora (b) dla przykładowego programu 
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Celem pokazania zmian zachodzących w rejestrach procesora, w czasie wykonywania 
tego programu, przedstawiono zawartości rejestrów A, B, PC, AD i RR w kolejnych 
fazach wykonywania programu. Dwa pierwsze rozkazy składają się z trzech cykli maszy- 
nowych: 

1) pobrania kodu operacyjnego oraz 4 bitów adresu, 

2) pobrania dalszych 16 bitów adresu, 

3) odczytu argumentu. 


Rozkaz dodawania nie wymaga dostępu do pamięci oprócz pobrania kodu rozkazu, ponie- 
waż jest to rozkaz z argumentami w rejestrach. Dlatego jest to rozkaz jednocyklowy. 


Pozostałe rozkazy są rozkazami trzycyklowymi. Po wykonaniu tego programu w rejestrze 
PC (i AD) jest adres 307. 


Ten sam program przy założeniu, że w liście rozkazów procesora znajduje się rozkaz 
dodawania, który specyfikuje adres wyniku można zrealizować znacznie prościej. Wów- 
czas program składa się z trzech rozkazów: dwóch rozkazów pobrania argumentów i roz- 
kazu dodawania wraz z zapisem do pamięci. Przy jeszcze innym założeniu, że rozkaz 
dodawania zawiera adres jednego z argumentów w pamięci, można wyeliminować rozkaz 
ładowania rejestru B i dodać zawartość rejestru A do zawartości komórki pamięci 
wyspecyfikowanej w rozkazie dodawania. W tym przypadku byłaby to komórka o ad- 
resie 915. 
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Najczęściej procesor wykonuje cykle maszynowe synchronicznie z zegarem. Każdy okres 
zegara nazywa się taktem. Na rysunku 4.5 pokazano kolejne takty cyklu maszynowego 
odczytu pamięci (lub cyklu pobrania rozkazu). Cykl maszynowy zaczyna się wysłaniem 
na magistralę adresową odpowiedniego adresu. W procesorze z rysunku 4.1 jest to 
zawartość rejestru AD. Po pewnym czasie (na rysunku 4.5 ok. 2 taktów) procesor wysyła 
sygnał strobu odczytu pamięci MR. Ten czas opóźnienia pomiędzy tymi sygnałami zależy 
od tzw. czasu dostępu do pamięci (por. rozdz. 5). Jest to czas, po którym pamięć odpowiada 
na żądanie odczytu, czyli wysyła na szynę danych zawartość odpowiedniej komórki. Na 
rysunku 4.5 pokazano przykładowy cykl maszynowy składający się z 4 taktów. Taki cykl 
zastosowano w komputerach IBM PC. Spotyka się także cykle maszynowe o innej liczbie 
taktów. Takt pierwszy jest zwykle przeznaczony na wysłanie adresu i tym samym na 
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Rysunek 4.5. Przebiegi czasowe w czasie cyklu maszynowego odczytu pamięci 
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inicjalizację procesu dostępu do pamięci. Takt drugi jest przeznaczony na sprawdzenie 
stanów na wejściowych liniach sterujących procesora. W takcie trzecim następuje odczyt 
(lub zapis) danej z pamięci 1 wreszcie takt czwarty może być przeznaczony na wykonanie 
samego rozkazu. 


Sygnały sterujące przychodzące na wejścia procesora są generowane przez układy 
współpracujące z procesorem (pamięci i urządzenia zewnętrzne) lub przez operatora 
(inicjalizacja pracy). Sygnały te wpływają na proces wykonywania programu. Wcześniej 
wymieniono już 4 sygnały. Były to sygnały: 

1) RESET — sygnał inicjalizacji pracy procesora po włączeniu napięcia zasilania. 
Sygnał ten ustawia pewien stan procesora, który powoduje, że po włączeniu 
zasilania, wykonywanie programu odbywa się zawsze od odczytania pierwszego 
rozkazu z tej samej komórki pamięci, określonej wcześniej przez projektanta 
stanu. Przykładowo RESET może np. zerować licznik rozkazów, aby pierwszym 
odczytywanym adresem był zawsze adres o numerze 0. 

2) STEP — sygnał wymuszający pracę krokową procesora. Oznacza to, że gdy 
sygnał jest aktywny, to procesor zatrzymuje się po każdym wykonanym rozkazie 
i czeka na decyzję operatora. Taki sposób pracy jest używany podczas urucha- 
mianiu systemu (lub programów). 

3) INT — sygnał przerwania pracy programu (ang. interrupt). Sygnał taki jest 
wysyłany przez układy współpracujące z procesorem, aby wymusić na nim wy- 
konanie specjalnego programu. Zadaniem takiego programu może być dokonanie 
transmisji odpowiedniej informacji do układu, który żąda przerwania. Przykła- 
dowo drukarka może wysłać sygnał przerwania, aby otrzymać do wydrukowania 
zawartość jakiegoś rejestru. Po wykonaniu tego programu procesor powraca do 
wykonywania programu właściwego. Dokładniej problem ten przedstawiono 
w rozdz. 6. 

4) HOLD — sygnał wstrzymania pracy programu. Sygnał jest wysyłany przez 
układy współpracujące z procesorem, aby wymusić na nim chwilowe zawieszenie 
pracy. Akcja ta ma na celu wymuszenie na procesorze zwolnienia magistrali 
(odłączenia się od magistrali), aby układy żądające zwolnienia mogły ją zająć dla 
wykonania przesłań, które nie dotyczą procesora. Przykładowo urządzenie ze- 
wnętrzne może zażądać odczytania informacji z pamięci. Przejmuje ono wówczas 
sterowanie magistrali, a po dokonaniu tej transmisji zwalnia ją, aby procesor mógł 
kontynuować wykonywanie programu. 


Po sprawdzeniu stanu wejściowych sygnałów sterujących procesor musi poinformować 
układy z nim współpracujące o swoich decyzjach. W tym celu generuje on wyjściowe 
sygnały sterujące. Na przykład po otrzymaniu sygnału INT procesor wysyła sygnał INTA, 
co oznacza zgodę na przerwanie wykonywania programu. Po sygnale HOLD procesor 
wysyła sygnał HLDA, który informuje układ żądający transmisji, że procesor wstrzymuje 
wykonywanie programu, zwalnia magistralę i układ żądający może dokonać transmisji. 
Taka transmisja nazywa się transmisją bezpośredniego dostępu do pamięci (ang. direct 
memory access — DMA). 


W trzecim takcie cyklu maszynowego następuje odczyt lub zapis pamięci i procesor 
wysyła sygnał strobu odczytu pamięci MR (ang. memory read) lub zapisu WR 
(ang. memory write). Jeśli jest to cykl pobrania rozkazu, to następuje zapisanie odczytanego 
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słowa do rejestru rozkazów RR. Jeśli jest to odczyt argumentów operacji, to następuje 
przesłanie zawartości odczytanej komórki pamięci do rejestru wyspecyfikowanego w roz- 
kazie. W czasie cyklu zapisu do pamięci, procesor wysyła strob zapisu pamięci MW 
i jednocześnie słowo, które ma zostać zapisane pod adres wysłany w pierwszym takcie. 
Słowo to jest wysyłane z rejestru na szynę danych. 


Jeśli rozkaz jest jednocyklowy, to takt czwarty jest przeznaczony na dekodowanie 
1 wykonanie rozkazu. W innym przypadku po zdekodowaniu rozkazu procesor decyduje 
o dalszej akcji. Na przykład, jeśli rozkaz wymaga odczytania argumentów z pamięci, to 
procesor przechodzi do wykonania odpowiednich cyklów maszynowych odczytu pamięci. 
Ponieważ procesor wykonuje także rozkazy przesłania danych pomiędzy swoimi rejestrami 
a urządzeniami zewnętrznymi, a transmisje te zachodzą poprzez magistralę, to musi on 
także generować sygnały strobów odczytu i zapisu dla urządzeń zewnętrznych. Są to strob 
odczytu urządzenia wejścia-wyjścia IOR (ang. input/output read) i strob zapisu urządzenia 
wejścia-wyjścia IOW (ang. input/output write). Tak więc w przykładowym procesorze 
lista sygnałów magistrali sterującej składa się z 10 następujących sygnałów: 

— wejściowe dla procesora: RESET, STEP, INT, HOLD 

— wyjściowe dla procesora: INTA, HLDA, MEMR, MEMW, IOR, IOW. 


4,4. BLOK ARYTMETYCZNO-LOGICZNY 


Blok arytmetyczno-logiczny ALU (ang. arithmetic-logical unit) jest często nazywany 
układem wykonawczym procesora, ponieważ wykonuje on większość rozkazów zlecanych 
procesorowi. Dalej omówiono jego najważniejsze funkcje oraz przykładową realizację. 
Blok ALU jest układem kombinacyjnym, który realizuje różne funkcje w zależności od 
zaprogramowanej operacji, tj. rozkazu umieszczonego w programie. Argumentami tych 
rozkazów są zwykle dwa słowa binarne. Rozkazy te mogą dotyczyć operacji arytme- 
tycznych (dodawanie 1 odejmowanie) lub logicznych (sumowanie, mnożenie, sumowanie 
mod 2 itp.). Blok ALU wykonuje także operacje jednoargumentowe, jak np. negowanie 
bitów lub operacje przesuwania zawartości rejestrów. Pośród sygnałów wejściowych ALU 
można wyróżnić dwie ich grupy: grupę wejść informacyjnych i grupę wejść sterujących. 
Na wejścia informacyjne podawane są dwa słowa, które są argumentami wykonywanej 
operacji. W zależności od długości słowa stosowanego w danym procesorze mówi się 
także o liczbie bitów ALU. Na przykład mikroprocesory, w których długość słowa wynosi 
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Rysunek 4.6. Oznaczenia końcówek czterobitowego ALU 
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16 bitów mają ALU 16-bitowe. Współczesne procesory, a więc i bloki ALU są projekto- 
wane jako układy wielkiej skali integracji. Natomiast celem łatwiejszego zrozumienia 
działania takich bloków, w podrozdziale tym przedstawiono standardowy 4-bitowy moduł 
ALU (odpowiednik układu SN 74181). 


Na rysunku 4.6 pokazano oznaczenia końcówek typowego układu ALU. Wejścia 
sterujące sQ—S; wraz z wejściem ustawiającym tryb pracy M (ang. mode) służą do 
programowania funkcji wykonywanych przez układ. W zależności od stanu na wejściu M 
układ wykonuje operacje logiczne lub operacje arytmetyczne. 


Tablica 4.1. Funkcje rcalizowane przez układ arytmetyczno-logiczny 


L.p. SQS15253 Operacje logiczne Operacje arytmetyczne 


M = 


M=l 


OOOO ZNANE 


1 0000 F=A F=A+C, 

2 1000 F = AVB F = (AvB) + Co 

3 0100 F = AB F = (AVB) + Cp 

4 1100 F=0 F=C,-1 

5 0010 F=AB F=A+AB+Cy 

6 1010 F=B F = (AvB) + AB + Co 
T 0110 F = AGB F=A-B-(1-C%) 
8 1110 F=AB F=A-(1-0) 

9 0001 F = AvB F=A+AB+C9 

10 1001 F = AGB F=A+B+Cy 

11 0101 F=B F = (AvB) + AB + Co 
12 1101 F=AB F=AB-(1-C5) 

13 0011 F=] F=2A+C5 

14 1011 F = AvB F = (AB) + A+Cy 
15 0111 F = AvB F = (AvB) + A+ Co 
16 11 F=A F=A-(1-Cy) 


— NN ZZ A 0 00 


W tablicy 4.1 zestawiono zbiór wszystkich funkcji wykonywanych przez ALU wraz 
z odpowiednimi wartościami sygnału M i Sy-S;. Argumenty operacji oznaczono przez A 
i B, a wynik operacji przez F. Zarówno argumenty jak i wynik są 4-bitowe. Nie wszystkie 
operacje zawarte w kolumnie „Operacje arytmetyczne” (M = 1) mają sens, tzn. da Się 
znaleźć ich sensowne zastosowanie. Są to operacje, w których występują jednocześnie 
działania logiczne i arytmetyczne. Powstały one podczas projektowania układu celem jego 
minimalizacji. Operacje te znajdują się w wierszach 2, 3, 5, 6, 8, 9, 11, 12, 14i 15. Z po- 
danego opisu wynika, że prezentowany układ wykonuje 22 operacje nazywane dalej 
mikrooperacjami. Wyboru odpowiedniej mikrooperacji dokonuje się przez podanie 5-bito- 
wego słowa sterującego (s,s,S,S, i M). 


W tablicy 4.1 zestawiono przypisanie poszczególnym słowom sterującym odpowiada- 
jących im operacji. Wyjaśnienia wymagają jeszcze 4 sygnały wyjściowe: C,, G, T i A =B. 
Sygnał C, jest tzw. przeniesieniem wyjściowym, powstającym w ostatnim stopniu 4- 
-bitowego sumatora. Sygnał ten jest wykorzystywany do łączenia ze sobą kilku takich 
samych układów, celem zaprojektowania sumatora operującego dłuższym słowem. W ta- 
kim połączeniu do wejścia C, (przeniesienie wejściowe) określonego stopnia sumatora 
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dołącza się sygnał wyjściowy C, z poprzedniego stopnia sumatora. Takie połączenie, 
zwane dalej połączeniem kaskadowym, ma pewną wadę. Polega ona na tym, że prze- 
niesienia generowane przez poszczególne stopnie są propagowane przez cały układ. Powo- 
duje to znaczne opóźnienie wprowadzane do operacji sumowania. Aby tego uniknąć, 
arytmometr wyposażono w dodatkowe wyjścia G i T. Są to sygnały dwóch przeniesień: 
tzw. przeniesienia generowanego i tzw. przeniesienia transmitowanego. Służą one do 
równoległego wyliczenia przeniesień wszystkich stopni sumatora zbudowanego z wielu 4- 
-bitowych układów (podobnie jak przeniesienia g, i p, w układzie sumatora jednobitowego). 
Sygnał wyjściowy A = B służy do wskazania przypadku kiedy argumenty operacji są 
równe. 


Rysunek 4.7. Dwie konfiguracje połączeń układów ALU 


Na rysunku 4.7 pokazano dwie konfiguracje połączeń dwóch układów ALU: jedną z 
przeniesieniem generowanym kaskadowo (rys. 4.7a) i drugą z przeniesieniem równoległym 
(rys. 4.7b). Na rysunku 4.7a przedstawiono 8-bitowy sumator dwóch słów wejściowych A, 
i B. Przeniesienie wyjściowe z tego bloku jest generowane kaskadowo i powstaje na 
wyjściu C, układu dolnego. Natomiast na rysunku 4.7b pokazano jak, celem przyspieszenia 
pracy CR połączono dwa sumatory 4-bitowe z układem wyliczającym przeniesienie 
w sposób równoległy (układ SN74182). Wylicza on przeniesienie wyjściowe na podstawie 
stanów na wyjściach T i G. Jak widać z rysunku układ ten zaprojektowano do współpracy 
z czterema sumatorami 4-bitowymi. 


Na rysunku 4.8 pokazano fragment 8-bitowego procesora (bez układu sterowania). 
Argumenty operacji dla bloku ALU są podawane z rejestrów A i B. Do rejestru A 
dołączono rejestr Q, który jest wykorzystywany przy wykonywaniu rozkazów 
arytmetycznego mnożenia 1 dzielenia (por. rozdz. 3). Rejestry A i Q są rejestrami 
przesuwającymi. Rejestr B ma tylko jedno wejście A m, które jest wejściem 
ładującym rejestr zawartością z magistrali (gdy mp = 1). Rajestty A i Q mają po dwa 


wejścia sterujące, ponieważ oprócz funkcji Hdówania wykonują także funkcję 
przesuwania. 
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Rysunek 4.8. Schemat prostego procesora bez układu sterowania 


Tablica 4.2. Mikrooperacje wykonywane przez rejestry arytmometru 


Operacja Wysterowanie 
MaMa 
załadowanie 11 
przesuwanie w lewo 10 
przesuwanie w prawo 01 
brak operacji 00 


W tablicy 4.2 przedstawiono wartości sygnałów m, o (Moo) i ma (mgo) programujące 
rejestr do wykonania odpowiedniej funkcji. Multiplekser na wejściu rejestru A jest stero- 
wany bitem m w taki sposób, że gdy m = 1, to rejestr A jest zapisywany z magistrali, a gdy 
m = 0, to jest zapisywany z wyjścia ALU. Aby wykonać określony rozkaz, cały ten układ 
musi być odpowiednio wysterowany sygnałami m, Mp, Mg Map Mop Mor Sg Sp Sp S3 
i M. Zadanie to wypełnia układ sterowania procesorem. W następnym podrozdziale za- 
prezentowano sposób, w jaki budowane są układy sterujące. 


4.5. UKŁADY STEROWANIA 


Operacje zestawione w tablicy 4.1 układ z rysunku 4.8 wykonuje w jednym kroku. Ale 
zwykle lista rozkazów procesora zawiera także rozkazy złożone, które procesor wykonuje 
w kilku krokach. Na przykład rozkaz dodawania dwóch liczb jest wykonywany w jednym 
kroku, ale rozkazy mnożenia i dzielenia są wykonywane w kilku krokach. Rozkazy te są 
wykonywane jako ciąg dodawań i przesuwań. W celu zapewnienia właściwego wystero- 
wania układu procesora trzeba zapewnić odpowiednie sekwencje słów podawanych na 
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wejścia sterujące układu ALU. Do tego celu stosuje się specjalne układy sterujące, które są 
złożonymi automatami sekwencyjnymi. Przy projektowaniu układów sterujących, które 
mają wymuszać odpowiednie pobudzenia układów wykonawczych, projektant napotyka 
się między innymi na trudności: 
— dla wymaganej liczby wykonywanych rozkazów automaty sterujące mają dużą 
liczbę stanów; 
— wymagane jest zapewnienie synchronizacji pracy układu sterowania i układu 
wykonawczego, tj. konieczność uwzględnienia, podczas projektowania układu 
logicznego, czasu wykonywania poszczególnych operacji. 


Aby przezwyciężyć te trudności poszukiwano od dawna efektywnych metod projektowania 
układów sterujących. W zasadzie spotyka się dwa typy układów sterowania: generatory 
sekwencji budowane ze standardowych układów logicznych oraz tzw. układy mikro- 
programowane. W niniejszym podrozdziale przedstawiono koncepcję układów mikropro- 
gramowanych. Jest to dawna (1951 r.) koncepcja podana przez Wilkesa, ale dopiero 
możliwości stworzone przez technologię LSI pozwoliły praktycznie ją zastosować. 
Koncepcja ta polega na wykorzystaniu pamięci wraz z odpowiednim układem adresowania 
do realizacji automatu sekwencyjnego. Takie układy sterujące pracują według algorytmów 
podanych w poprzednim rozdziale, a ich opis jest zwykle dany w postaci sieci działań. 
W niniejszym podrozdziale przedstawiono takie automaty, podano ich strukturę, sposób 
opisu 1 metody realizacji. 


Warunki zewnętrzne 
WAR ZEWN 


Rysunek 4.9. Struktura układu sterowania 


6 — Podstawy budowy i działania komputerów 
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Na rysunku 4.9 pokazano ogólny schemat układu sterującego. W układzie tym zasad- 
niczą częścią jest pamięć PAM, która zwykle jest pamięcią stałą, tj. zapisywaną jedno- 
krotnie podczas uruchamiania systemu (por. rozdz. 5). Na wejściu układu jest umieszczony 
rejestr rozkazów RR, do którego jest zapisywany kod rozkazu, który ma być wykonany. 
Zawartość rejestru jest przekształcana w taki sposób, aby stanowiła adres pamięci PAM 
i na podstawie tego adresu można było odczytać z pamięci słowo sterujące. Ponieważ 
adres pamięci może pochodzić także z innych źródeł, to rejestr adresowy RA adresujący 
pamięć stałą jest zapisywany z 3 źródeł poprzez multiplekser. Źródłami tymi są: rejestr 
RR (wraz z dekoderem), zawartość pamięci (w odczytywanym słowie sterującym jest 
także pamiętany adres następnego mikrorozkazu) oraz układ następnika. Zawartość od- 
czytanej komórki pamięci jest zapisywana do rejestru wyjściowego RM, czyli do 
tzw. rejestru mikrooperacji. W pokazanym układzie odczytane słowo podzielone jest na 
trzy części: część adresową (wskazującą adres następnego mikrorozkazu), część operacyjną 
określającą wysterowanie procesora (WY) oraz część określającą źródło następnego mikro- 
rozkazu (sterowanie multiplekserem). Istnieją także modyfikacje podanej struktury, gdyż 
można zaprojektować układy bez rejestru RA lub bez rejestru RM. 


Jeżeli procesor ma wykonać rozkaz w jednym kroku, to na jego wejścia sterujące 
podaje się tylko jedno słowo z układu sterującego. Natomiast jeśli rozkaz jest rozkazem 
złożonym, to układ sterowania musi wygenerować odpowiedni ciąg słów, który nazywa 
się mikroprogramem. Jednemu krokowi rozkazu odpowiada jedno słowo wyjściowe układu 
sterowania, czyli jeden mikrorozkaz wymuszający w układzie ALU odpowiednią mikro- 


Tablica 4.3. Mikroprogram mnożenia w kodzie U2 


Nr Adres Mikrooperacja W1 K  WarQ, Komentarz 
0 00000 xxxxx 01110011001 0 — ład. A — 0 i B & mnożna 
1 00001 00011 000011xxxxx 0 q ładowanie Q + mnożnik 
2 00010 xxxxx 00000010010 0 — warunkowe dodawanie 
3 00011 00101 000101xxxxx 0 q przesuwanie w prawo 
4 00100 xxxxx 00000010010 0 — warunkowe dodawanie 
5 00101 00111 000101xxxxx 0 q przesuwanie w prawo 
6 00110 xxxxx 00000010010 0 — warunkowe dodawanie 
fi 00111 01001 000101xxxxx 0 q przesuwanie w prawo 
8 01000 xxxxx 00000010010 0 — warunkowe dodawanie 
9 01001 01011 000101xxxxx 0 q przesuwanie w prawo 
10 01010 xxxxx 00000010010 0 — warunkowe dodawanie 
11 01011 01101 000101xxxxx 0 q przesuwanie w prawo 
12 01100 xxxxx 00000010010 0 — warunkowe dodawanie 
13 01101 01111 000101xxxxx 0 q przesuwanie w prawo 
14 01110 xxxxx 00000010010 0 — warunkowe dodawanie 
15 01111 10010 000101xxxxx 0 q przesuwanie w prawo 
16 10000 xxxxx 00000001110 0 — warunkowe odejmowanie 
17 10001 xxxxx 000101xxxxx 1 — przesuwanie w prawo 
18 10010 Pierwsza operacja następnego rozkazu 
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operację. W każdym algorytmie kolejność wykonywania działań może być bezwarunkowa 
„lub warunkowa. Jeśli jest bezwarunkowa, to działania te są wykonywane sekwencyjnie, tj. 
kolejno jedno po drugim. Po wykonaniu jednego działania musi zostać wskazane następne. 
Jednym ze sposobów realizacji tego jest wskazanie w słowie mikrooperacji adresu na- 
stępnej mikrooperacji. Najłatwiej jednak następną mikrooperację umieścić w następnej 
komórce pamięci (jeśli jest to możliwe). Dlatego do wejść multipleksera dołączono wyjścia 
z układu następnika oraz wyjścia rejestru RM. Odpowiednie wysterowanie multipleksera 
pozwoli wtedy wybrać następną komórkę pamięci. Jeśli kolejność działań jest warunkowa 
(w algorytmie pojawia się rozgałęzienie), to adres następnej mikrooperacji jest uzależniony 
od spełnienia warunku. Sekwencja warunkowa jest realizowana przez odpowiednie wy- 
sterowanie multipleksera w zależności od warunków zewnętrznych (wejście WAR ZEWN). 


Aby zilustrować podany opis, zaprojektowano układ .sterujący blokiem ALU, który 
wykona rozkaz mnożenia w kodzie U2. Przedstawiony wcześniej algorytm (por. rozdz. 3) 
trzeba przełożyć na ciąg mikrooperacji. Zgodnie z tym co wcześniej powiedziano, w słowie 
mikrooperacji można wyróżnić trzy części: część adresową wskazującą adres następnej 
mikrooperacji, część sterującą z 11 bitami wysterowania układu z rys. 4.8 oraz część 
określającą źródło następnego mikrorozkazu. W tym przykładzie mamy tylko jeden wa- 
runek zewnętrzny z układu wykonawczego. Jest to najmniej znaczący bit rejestru Q (Q,). 
Załóżmy także tylko jednobitową część wskazującą źródło następnego rozkazu, czyli 
sterowanie multiplekserem. Będzie to bit K wskazujący na moment zakończenia mikro- 
programu. Format słowa mikrooperacji jest przedstawiony na rysunku 4.10. 


pole adresu pole 
następnego sterujące 
rozkazu pole sygnałów sterujących multiplekerów 


Rysunek 4.10. Format słowa mikrooperacji 


W tablicy 4.3 przedstawiono ciąg mikrooperacji wraz z komentarzem. Mikrooperacja 
ładowania rejestru Q i mikrooperacje przesuwania mają w polu warunku wpisaną wartość 
Q,, co wskazuje, że następująca po nich mikrooperacja jest warunkowa i zależy od 
wartości najmniej znaczącego bitu rejestru Q. Oznacza to, że multiplekser (por. rys. 4.9) 
musi zostać wysterowany przez Q, tak, aby w zależności od tego bitu nastąpiło 
rozgałęzienie w mikroprogramie. Bit ten jest podawany na jedno z wejść multipleksera, 
a na drugie wejście jest podawany bit K z mikroprogramu. Jeśli Q, i K są równe 00, to na 
wyjściu multipleksera pojawia się zawartość układu następnika. Jeśli Q, 1 K są równe 10, 
to na wyjściu multipleksera pojawi się część adresowa mikrooperacji. Jeśli natomiast K 
jest równe 1, to na wyjściu multipleksera pojawi się zdekodowana zawartość rejestru RR 
i rozpocznie się nowy mikroprogram. 


Mikrooperacja rozpoczynająca mikroprogram znajduje się pod umownym adresem 0. 
Powoduje ona załadowanie odpowiednich wartości do rejestrów A i B. W polu adresowym 
tej mikrooperacji są wartości nieokreślone, ponieważ zawsze po niej jest wykonywana 
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mikrooperacja spod adresu 1 (ładowanie mnożnika do rejestru Q). W czasie wykonywania 
tej operacji jest badany warunek, i w zależności od wartości q na wyjściu multipleksera, 
pojawia się albo adres 2 z układu następnika (gdy q = 1 i następną operacją jest dodawanie), 
albo adres 3 z pola adresowego mikrorozkazu (gdy q = 0 i następną operacją jest następne 
przesuwanie). Czynności te powtarzają się jeszcze 7 razy, aż do ostatniego kroku, czyli 
warunkowego odejmowania. W czasie wykonywania mikrooperacji określonej przez 
mikrorozkaz spod adresu 15 jest badany warunek i albo wybierany jest adres następny 
(q= 1 i następną operacją jest odejmowanie), albo wybierany jest adres z części adresowej 
mikrooperacji i wybierany jest adres 18 (q = 0 i następuje koniec mikroprogramu). 


Przykładowy mikroprogram zajmuje pamięć stałą o pojemności 18 słów 17-bitowych 
i realizuje tylko jeden rozkaz. W przykładzie wystarczy zastosować pamięć o pojemności 
32 słowa, więc adresowaną 5 bitami. Można zauważyć, że ten mikroprogram można 
napisać inaczej. Ponieważ znana jest z góry liczba kroków a w każdym kroku pojawiają 
się dwa mikrorozkazy (przesuwanie i dodawanie), to można zastosować pętlę rozkazów. 
Rzeczywiste układy sterujące zawierają wiele mikroprogramów, po jednym dla każdego 
rozkazu. Pojemności pamięci stałej układów sterujących wynoszą tysiące słów, niekiedy 
ponad 100-bitowych. 


4.6. PRZYKŁADOWA LISTA ROZKAZÓW 


Typowy zbiór rozkazów prostego procesora składa się z 4 grup rozkazów: 
l) rozkazów arytmetyczno-logicznych; 
2) rozkazów przesłań (pomiędzy procesorem i pamięcią lub procesorem i urządzenia- 
mi zewnętrznymi); 
3) rozkazów sterujących wykonywaniem programu; 
4) rozkazów sterujących pracą procesora. 


Dalej przedstawiono przykładowe rozkazy z podanych czterech grup. Skrótowe nazwy 
rozkazów, zwane mnemonikami podano w języku angielskim, gdyż są one powszechnie 


zaakceptowane. Jako przykładowe mnemoniki przyjęto stosowane w popularnych kompu- 
terach IBM PC. 


4.6.1. ROZKAZY ARYTMETYCZNO-LOGICZNE 


ROZKAZY ARYTMETYCZNE 
ADD — addition — dodawanie; 


SUB — subtraction — odejmowanie; 

MUL — multiplication — mnożenie; 

DIV — division — dzielenie; 

ABS — absolute — wartość bezwzględna liczby; 
NEG — negate — zmiana znaku liczby; 

INC — increment — zwiększenie wartości o jeden; 
DEC — decrement — zmniejszenie wartości o jeden. 


Zgodnie z tym co powiedziano w poprzednich podrozdziałach argumenty oraz wyniki 
działania rozkazu nazywać będziemy operandami. Pierwsze 4 rozkazy tej grupy są dwu- 
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argumentowe. Dlatego rozkazy te muszą wskazywać trzy operandy: dwa dla dwóch argu- 
mentów operacji i jeden dla wyniku. Zatem każdy taki rozkaz musi specyfikować trzy 
adresy. Ponieważ takie rozwiązanie zmuszałoby do wydłużania instrukcji, a co za tym 
idzie programów, to zmierza się do zmniejszania liczby adresów operandów. Można 
przyjąć wtedy, że jeden z argumentów jest zawsze przechowywany w tym samym miejscu. 
np. w akumulatorze i tam też przesyłany jest wynik operacji. W takim przypadku specy- 
fikacji wymaga tylko jeden operand. Zagadnienie to opisano także przy omawianiu rozka- 
zów sterujących pracą procesora. 


Następne 4 podane rozkazy są jednoargumentowe i dlatego każdy z nich specyfikuje 
jedynie dwa adresy operandów. Wszystkie podane rozkazy powodują odpowiednie 
ustawianie bitów w rejestrze znaczników na wyjściu ALU (por. podrozdz. 4.1). Argu- 
mentami takich rozkazów mogą być liczby stałopozycyjne i zmiennopozycyjne. 


ROZKAZY OPERACJI LOGICZNYCH 
AND — conjuction — iloczyn; 


OR — disjunction — suma; 
EXOR—  exclusive-OR — suma mod 2; 
NOT — complement — negacja. 


Pierwsze trzy rozkazy są dwuargumentowe i tylko ostatni rozkaz jest jednoargumen- 
towy. Argumenty tych rozkazów mogą być adresowane na różne sposoby. Wykonanie 
omawianych rozkazów także powoduje odpowiednie ustawienie znaczników. 


"ROZKAZY PRZESUWANIA 


SHL — shift left — przesuwanie zawartości rejestru w lewo (na najmniej znaczącą 
pozycję wpisywane jest 0, a na najbardziej znaczącą pozycję jest zapisywany 
znacznik przeniesienia). 

SHR — shift right — przesuwanie zawartości rejestru w prawo (na najbardziej 
znaczącą pozycję wpisywane jest 0, a na najmniej znaczącą pozycję jest za- 
pisywany znacznik przeniesienia). 

SAL — shift arithmetic left — przesuwanie arytmetyczne w lewo (jak SHL), czyli 
mnożenie przez 2 z zachowaniem bitu znaku. 

SAR — shift arithmetic right — przesuwanie arytmetyczne w prawo, czyli dzielenie 
przez 2 (najbardziej znaczący bit jest pozostawiany a najmniej znaczący jest 
zapisywany na pozycję znacznika przeniesienia). 

ROL — rotate left — przesuwanie cykliczne w lewo (najbardziej znaczący bit jest 
zapisywany na najmniej znaczącą pozycję oraz na pozycję znacznika przenie- 
sienia). 

ROR — rotate right — przesuwanie cykliczne w prawo (najmniej znaczący bit jest 
zapisywany na najbardziej znaczącą pozycję i na pozycję znacznika prze- 
niesienia). 

RCL — rotate left with extend — przesuwanie cykliczne w lewo rejestru wydłu- 
żonego o znacznik przeniesienia. 

RCR — rotate right with extend — przesuwanie cykliczne w prawo rejestru wydłu- 
żonego o znacznik przeniesienia. 
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Wszystkie podane operacje są jednoargumentowe. Rozkazy przesunięć mogą dotyczyć 
zarówno zawartości rejestrów jak 1 zawartości komórki pamięci. W niektórych kompu- 
terach można spotkać różne modyfikacje tych rozkazów, jak np. przesuwanie na dwóch 
połączonych rejestrach lub przesuwanie dwuargumentowe, gdzie drugi argument określa 
liczbę pozycji o jaką ma być przesunięta zawartość danego rejestru. 


4.6.2. ROZKAZY PRZESŁAŃ 


MOV — move — przesłanie słowa pomiędzy rejestrami procesora. 


STR — store — przesłanie słowa ze wskazanego w rozkazie rejestru procesora do ko- 
mórki pamięci. 

LD —  load— przesłanie słowa z pamięci do wskazanego rejestru procesora. 

XCH — exchange — wymiana zawartości rejestrów. 

IN — input — odczyt słowa z urządzenia wejściowego. 

OUT — output — przesłanie zawartości wskazanego rejestru procesora do urządzenia 
wyjściowego. 

CLR — clear — zerowanie rejestru. 

SET — set — zapisanie do rejestru jedynek. 


PUSH— push — zapisanie zawartości rejestru na stos (wyjaśnienie pojęcia stosu w dal- 
szym ciągu tekstu). 
POP — pop — odczyt słowa z wierzchołka stosu i przesłanie go do rejestru. 


Pierwsze 6 rozkazów to rozkazy jednoargumentowe. Muszą one jednak specyfikować dwa 
adresy operandów. Pierwszy z nich wskazuje miejsce skąd pochodzi argument operacji 
(źródło), a drugi wskazuje miejsce jego przesłania (przeznaczenie). Istnieją procesory, 
w których rozkazy takie mogą być modyfikowane w taki sposób, aby ich wykonanie było 
wielokrotne, tj. powtarzane określoną przez rozkaz liczbę razy. Umożliwia to przesyłanie 
całych bloków słów. Mówimy, że są to rozkazy z powtarzaniem. W takim przypadku 
rozkazy te są dwuargumentowe, gdyż drugi argument specyfikuje ile razy ten rozkaz ma 


być wykonany. Pozostałe cztery rozkazy wymienione w tej grupie są rozkazami jedno- 
argumentowymi. 


4.6.3. ROZKAZY STERUJĄCE PRACĄ PROGRAMU 


JMP — jump — skok bezwarunkowy do miejsca w pamięci wyspecyfikowanego w roz- 
kazie. 
Jc — jump conditional — skok warunkowy, gdzie c określa jaki warunek musi być 


spełniony, aby rozkaz wykonać. 

CALL— jump to subroutine — wywołanie podprogramu polegające na tym, że wykony- 
wany jest skok wraz z zapamiętaniem na stosie zawartości licznika rozkazów 
(ostatni adres). 

Cc — call conditional — warunkowe wywołanie podprogramu. 

RET — return — skok powrotny z podprogramu polegający na przesłaniu ze stosu 
zapamiętanej wcześniej zawartości licznika rozkazów. 

SKIP — skip — przeskok przez jeden rozkaz. 


Rozkazy warunkowe są wykorzystywane do realizacji rozgałęzień w programach. Jeśli 
warunek nie jest spełniony, to rozkaz nie jest wykonywany, a wykonywany jest rozkaz 
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następny, tj. znajdujący się w programie po rozkazie warunkowym. Rozkazy skoków 
i wywołań zawierają adres skoku, tj. adres komórki pamięci, w której znajduje się rozkaz 
wykonywany bezpośrednio po wykonaniu rozkazu skoku. 


4.6.4. ROZKAZY STERUJĄCE PRACĄ PROCESORA 


HALT — stop — zatrzymanie wykonywania programu. 
NOP — no operation — rozkaz pusty. 


Rozkaz HALT zatrzymuje pracę procesora, aż do momentu ponownego uruchomienia 
programu przez zdarzenie zewnętrzne (ponowną inicjalizację procesora, czyli po po- 
jawieniu się sygnału RESET lub po zgłoszeniu przerwania, tj. pojawieniu się sygnału 
INT), a rozkaz NOP jest rozkazem pustym — „nic nie rób”. 


Przedstawiona lista rozkazów stanowi uproszczony przykład zbioru rozkazów proce- 
sora. Z tego opisu wynika jednak kilka ważnych problemów, które będą dalej przed- 
stawione. Pierwszym z nich jest problem liczby adresów, które powinny zostać 
wyspecyfikowane w rozkazie. W zasadzie każdy rozkaz powinien podawać adresy 3 ope- 
randów (dwa adresy argumentów danego rozkazu i jeden adres wyniku operacji) oraz 
adres następnego rozkazu. Komputery, których rozkazy zawierają te wszystkie adresy 
nazywane są komputerami czteroadresowymi. Dla wyspecyfikowania podanych 4 adresów 
potrzebne są bardzo długie słowa rozkazowe. Celem zmniejszenia długości rozkazu stosuje 
się rozwiązania pozwalające wyeliminować pewną liczbę adresów. Jednym z nich było 
wprowadzenie licznika rozkazów, co pozwoliło na eliminację adresu następnego rozkazu 
i konstrukcję komputerów trzyadresowych. Celem dalszego ograniczenia liczby adresów 
można przyjąć założenie, że dla wszystkich operacji wynik będzie przesyłany w miejsce 
jednego z argumentów. Wówczas można zmniejszyć liczbę adresów do dwóch. W kom- 
puterach o bardzo krótkim słowie rozkazowym (np. mikrokomputery 8-bitowe) stosuje się 
dalsze ograniczenie liczby adresów przez rozwiązanie polegające na tym, że jeden z argu- 
mentów wszystkich rozkazów i wynik jest zawsze w tym samym miejscu (na przykład 
w rejestrze akumulatora). Takie komputery nazywane są jednoadresowymi. 


Istnieje także technika obliczeń umożliwiająca wykorzystanie komputerów bezadreso- 
wych. Ideę tej techniki podał Łukasiewicz i znana jest jako notacja polska (ang. Polish 
notation). Notacja zapisu wyrażeń arytmetycznych polega na tym, że każda operacja 
arytmetyczna jest poprzedzona jej argumentami. Na przykład wyrażenie: 


y =(a—b)/c + d'e 
przedstawia się jako: 
y =a b — c/de: + 


co oznacza, że operacja odejmowania dotyczy argumentów a i b, operacja dzielenia 
dotyczy wyniku poprzedniego działania i c, operacja mnożenia argumentów d i e, a 
argumentami dodawania są wyniki poprzednich operacji. Algorytm obliczeń działający 
według takiego zapisu jest przedstawiony następująco: 
1) Sprawdza się kolejność elementów zapisu od znaku równości w prawą stronę. 
2) Jeżeli napotkany element jest argumentem, to jest on zapisywany na stos. Jeżeli 
napotkany element jest znakiem działania, to ze stosu są odczytywane dwa 
argumenty i wykonywane jest to działanie. 
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Wyjaśnienia wymaga pojęcie stosu (ang. stack). Stosem nazywa się spójny obszar pamięci, 
tzn. taki, którego kolejne komórki mają kolejne adresy. Układ sterujący stosem pamięta 
tylko jeden adres, który jest przechowywany w miejscu zwanym wskaźnikiem stosu 
(ang. stack pointer). Miejsce to może być komórką pamięci, ale najczęściej jest to spec- 
jalny rejestr procesora. Zapis danej na stos jest dokonywany zawsze pod adres zawarty we 
wskaźniku stosu. Na początku pracy we wskaźniku stosu jest adres bazowy (najmniejszy 
adres obszaru pamięci przeznaczonego na stos). Po każdorazowym zapisie danej na stos 
dokonuje się inkrementacji wskaźnika, a więc zwiększenia adresu o 1. Dlatego wskaźnik 
stosu zawiera zawsze adres następnego „wolnego miejsca dla zapisu. Natomiast chcąc 
odczytać informację ze stosu należy najpierw dokonać dekrementacji wskaźnika. Taka 
zasada powoduje, że istnieje dostęp tylko do tzw. wierzchołka stosu. W czasie zapisu 
pojemność stosu jest zwiększana, a podczas odczytu jest zmniejszana. Oczywiście w cza- 
sie zapisu rośnie obszar pamięci zajmowanej przez stos, a podczas odczytu maleje. Istnieje 
zawsze ograniczenie pojemności stosu. Najmniejszy adres jest nazywany bazą stosu, 
a największy limitem stosu. Stos można zorganizować także sprzętowo za pomocą zbioru 
rejestrów. 
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Rysunek 4.11. Algorytm obliczenia wyrażenia przedstawionego w notacji polskiej 


Na rysunku 4.11 przedstawiono algorytm obliczeń podanego wyrażenia zapisanego 
w notacji polskiej wraz z mapą stosu dla kolejnych kroków tego przykładu. W podanym 
wyrażeniu pierwszym elementem jest argument, więc jest on zapisywany na stos 
(rys. 4.1la). Następnym elementem jest także argument, więc i on jest zapisywany na stos 
(rys. 4.11b). Kolejnym elementem wyrażenia jest operacja odejmowania, więc poprzednie 
argumenty są odczytywane ze stosu, wykonywana jest operacja odejmowania i wynik jest 
zapisywany na stos (rys. 4.11c). Następne operacje to: 

— zapis argumentu c na stos (rys. 4.11d/), 

— operacja dzielenia dwóch kolejnych zawartości wierzchołków stosu i przesłanie 

wyniku na stos (rys. 4.1le), 

— zapis argumentu d na stos (rys. 4.11f), 

— zapis argumentu e na stos (rys. 4.11g), 

— operacja mnożenia i zapis wyniku na stos (rys. 4.11h), 

— operacja dodawania i zapis wyniku na stos (rys. 4.11i). 


Działania tego typu były często wykorzystywane w kalkulatorach, gdzie użytkownik 
wpisując przemiennie argumenty i operacje decyduje o wykonywanych działaniach. 
W komputerach o dużej mocy obliczeniowej, które posługują się długimi słowami maszy- 
nowymi, stosuje się rozkazy 2- lub 3-adresowe. W mikrokomputerach, ze względu na 
niewielką długość słowa maszynowego, często stosuje się rozkazy jednoadresowe. 
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4.7, TRYBY ADRESOWANIA 


Jak już wcześniej powiedziano argumenty operacji mogą znajdować się w kodzie pro- 
gramu, w rejestrach procesora lub w pamięci. W zależności od miejsca, gdzie znajdują się 
argumenty, stosuje się odpowiednie rozkazy, które występują w różnych odmianach. 
Mówimy, że są to rozkazy o różnych trybach adresowania (ang. addressing mode). 


Blok rejestrów 

b ||| kodoweracjny GENE 
Blok rejestrów 

C || kodopercjn | agimehu R 
Adres argumentu 
Pamięć 

d ||| kos operacny == 

e ||| kodoperacjy E 


Rysunek 4.12. Proste tryby adresowania argumentów 


Jeżeli argument znajduje się w rozkazie, to tryb adresowania nazywa się trybem 
natychmiastowym (ang. immediate mode). Postać takiego rozkazu przedstawiono na ry- 
sunku 4.12a. Jeżeli argument znajduje się w rejestrze, to tryb adresowania nazywa się 
trybem rejestrowym (ang. register mode), a jego postać pokazano na rysunku 4.12b. 
Można zauważyć, że rozkaz zawiera numer rejestru procesora, w którym przechowywany 
jest argument operacji. W trzecim przypadku, jeżeli argument rozkazu znajduje się w pa- 
mięci, to tryby adresowania mogą być różne, w zależności od tego, gdzie znajduje się jego 
adres. Adres, podobnie jak sam argument, może być w kodzie programu (w rozkazie), 
w rejestrze procesora 1 w pamięci. Jeśli adres argumentu jest w rozkazie, to tryb adre- 
sowania jest nazywany trybem bezpośrednim (ang. direct mode). Postać takiego rozkazu 
i uproszczoną mapę pamięci przedstawiono na rysunku 4.12c. Jeśli adres znajduje się 
w rejestrze, to tryb taki nazywany jest trybem rejestrowym pośrednim (ang. register 
indirect mode), a postać rozkazu i mapa pamięci jest pokazana na rysunku 4.12d. Jeśli zaś 
adres jest w pamięci, to tryb ten nazywa się trybem adresowaniem pośrednim 
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(ang. indirect mode), który polega na tym, że w rozkazie musi być adres komórki pamieci, 
w której przechowywany jest właściwy adres argumentu (rys. 4.12e). Ten tryb adresowania 
jest stosowany wówczas, gdy programista odwołuje się do argumentów umieszczonych 
w stałym miejscu pamięci. 


Przedstawione tryby adresowania nazywane są jednoskładnikowymi, gdyż adres ope- 
randu był wyznaczany na podstawie jednego składnika. W nowoczesnych komputerach do 
adresowania argumentów przeznacza się więcej niż jeden składnik. Pozwala to na zwięk- 
szenie efektywności programowania, gdyż umożliwia wprowadzenie dodatkowych trybów 
adresowania, które ułatwiają posługiwanie się bardziej złożonymi strukturami danych jak 
np. wektorami lub tablicami. 


Często stosowaną techniką jest technika posługiwania się dwoma składnikami, z któ- 
rych jeden jest nazywany bazą (ang. base) a drugi przemieszczeniem (ang. displacement). 
Adres argumentu jest określany jako suma tych dwóch składników, choć w niektórych 
komputerach stosuje się inne operacje. Jeśli jest to suma, to przemieszczenie wskazuje na 
odległość pomiędzy adresem bazowym a adresem operandu. Dwuskładnikowy sposób 
adresowania umożliwia kilka kombinacji posługiwania się tymi adresami. Jeżeli progra- 
mista zna wartość składnika w czasie pisania programu (przed kompilacją), to mówi się, 
że składnik jest stały. Stały składnik jest umieszczany przez programistę w kodzie 
programu (w rozkazie). Mówi się, że składnik jest zmienny, gdy jest on wyliczany przez 
program, a więc jego wartość jest znana dopiero w czasie wykonywania programu (po 
kompilacji). W takim przypadku programista wskazuje w programie rejestr procesora, do 
którego składnik taki jest zapisywany po wyliczaniu go przez program. Jeżeli są dwa 
składniki, tj. baza i przemieszczenie, to należy rozpatrzyć 4 przypadki pokazane 
w tablicy 4.4. 


Jeden z tych przypadków jest trywialny i nie jest wykorzystywany. Drugi przypadek, 
gdy tylko baza jest stała, jest nazywany trybem adresowania indeksowym. Przemiesz- 


Tablica 4.4. Tryby adresowania 


przemieszczenie stałe 


przemieszczenie zmienne 


baza stała — indeksowy 


baza zmienna bazowy bazowo-indeksowy 


czenie jest wówczas zwane przesunięciem lub indeksem (ang. offset) i jest wyliczane 
w czasie wykonywania programu, a następnie ładowane do rejestru, zwanego zwykle 
rejestrem indeksowym. Baza, która jako czynnik stały znajduje się w kodzie programu, 
może być wykorzystana na dwa sposoby. Każdy z nich inaczej oblicza tzw. adres efek- 
tywny (ang. effective address): 

l. EA =M [baza + indeks], 

2. EA = M [baza] + indeks. 


Pierwszy sposób jest nazywany preindeksowym. Suma bazy i przemieszczenia wskazuje 
na adres pośredni, tj. adres komórki pamięci, gdzie znajduje się adres operandu. Drugi 
sposób zwany postindeksowym polega na tym, że adres pośredni jest wskazywany przez 
samą bazę, a zawartość komórki spod adresu pośredniego jest dodawana do przemiesz- 
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a Blok rejestrów 
Kod operacny REEE 
Pamięć 
b Blok rejestrów 


Przemieszczenie 


Rysunek 4.13. Złożone tryby adresowania indeksowego: a) preindeksowe i b) postindeksowe 


czenia tworząc adres efektywny. Na rysunku 4.13 pokazano graficznie różnicę pomiędzy 
tymi sposobami. 


Adresowanie indeksowe jest stosowane do posługiwania się złożonymi strukturami 
danych, jak np. wektory czy tablice. Jeśli ustali się miejsce początku wektora w pamieci, 
to baza jest stała i poszczególne składowe wektora są wyliczane przez program i jako 
przesunięcie umieszczone w rejestrze indeksowym. Trudniejszy problem powstaje, gdy 
element wektora zajmuje więcej niż jedną komórkę pamięci. Tak może zdarzyć się w kom- 
puterach z pamięcią o krótkim słowie, np. 8-bitowym. Jeśli składnik wektora jest 32- 
-bitowy, to zajmuje on 4 bajty i odczyt całego składnika odpowiada 4 odczytom pamieci. 
Rozwiązanie tego problemu jest możliwe przez wprowadzenie tzw. skalowania, tj. mnoż- 
nika przesunięcia, który dostosowuje przesunięcie do długości operandu. W omawianym 
przykładzie można zastosować skalę 4, tj. jeśli przesunięcie jest 5 (piąty składnik wektora), 
to adres jego jest o 4 x 5 = 20 większy od adresu bazowego. 


Trzeci przypadek z tablicy 4.4 jest nazywany bazowym trybem adresowania. Tym 
razem przemieszczenie jest stałe, a zmienna jest baza. Jeżeli baza i przemieszczenie mają 
tę samą długość, to nie ma żadnej różnicy pomiędzy trybem indeksowym i bazowym. 
W trybie indeksowym rozkaz musiał być odpowiednio długi, gdyż baza umieszczona 
w kodzie programu musi mieć długość równą długości adresu pamięci. W trybie bazowym 
rozkaz może być krótszy, ponieważ długość przemieszczenia łatwiej można ograniczyć. 
Jeżeli natomiast ograniczenie utrudnia efektywność programowania, to wprowadza się 


różną długość przemieszczenia. Stosuje się na przykład przemieszczenia krótkie i prze- 
mieszczenia długie. 


04 4. Procesory 


Przykładowo załóżmy, że w mikrokomputerze 8-bitowym jest pamięć o pojemności 
64 kB, co odpowiada 16-bitowemu adresowi. Stosując adresowanie indeksowe należy 
w rozkazie umieścić 16-bitową bazę, a więc rozkaz w takim trybie adresowania będzie co 
najmniej 3-bajtowy. Stosując adresowanie bazowe można ograniczyć przemieszczenie do 
256 i wówczas rozkaz może być 2-bajtowy. Jeśli jest to niedogodne, to można zastosować 
2 rodzaje rozkazów: jedne 2-bajtowe z przemieszczeniem ograniczonym do 256 i drugie 
3-bajtowe z przemieszczeniem ograniczonym do 16K. 


Adresowanie bazowe jest pomocne przy stosowaniu relokowalnych procedur, pod- 
programów, funkcji lub bloków danych (por. rozdz. 7 i 8). W takich przypadkach adres 
początkowy, tj. baza może być zmieniana przez system operacyjny, a przemieszczenia 
w programie poprawnie adresują lokalne zmienne lub parametry (por. rozdz. 7). 


W przypadku gdy oba składniki są zmienne, to tryb adresowania nazywamy bazowo- 
-indeksowym. Oba składniki znajdują się w rejestrach, gdyż są wyliczane dopiero w czasie 
wykonywania programu. Procesor, który umożliwia taki tryb adresowania najczęściej jest 
wyposażony w dwa rejestry służące adresacji. Jeden z nich nazywany jest rejestrem 
indeksowym, a drugi rejestrem bazowym. 


Specjalną odmianą trybu adresowania dwuskładnikowego jest tryb, który jako rejestr 
adresu bazowego wykorzystuje licznik rozkazów PC. Chodzi o stworzenie możliwości 
adresowania danych względem aktualnej wartości licznika rozkazów. Z tablicy 4.4 wynika, 
że licznik rozkazów może być wykorzystany na dwa sposoby. Pierwszy wykorzystuje 
rejestr PC jako rejestr bazowy (tryb adresowania bazowy). Wówczas zmienne przemiesz- 
czenie o niewielkiej długości (często dane i rozkazy są blisko siebie w pamięci, tj. lo- 
kalność danych) może być zapisywane do innych rejestrów procesora. Jest to tryb bazowy, 
zwany adresowaniem względnym (ang. relative addressing). Druga z nich to zwykłe 
adresowanie bazowo-indeksowe (ang. base indexed), zwane także indeksowo-względnym 
(ang. relative-indexed addressing). 


W wielu nowoczesnych komputerach stosowane są także tryby adresowania wykorzys- 
tujące więcej niż jeden składnik do obliczenia adresu efektywnego. Istnieje wielka gama 
możliwości różnych kombinacji tych składników i tworzenia wielu rodzajów trybów 
adresowania. Tutaj przedstawiono jedynie przykład ilustrujący jedną z tych możliwości. 
Niech rozkaz zawiera numer rejestru, w którym przechowywany jest adres bazowy AB, 
a także dwa rodzaje przemieszczenia: jedno dla trybu bazowego — pb i drugie dla trybu 
indeksowego — pi. Jeśli założyć, że procesor zawiera skalowany rejestr indeksowy RI, to 
efektywny adres operandu może być utworzony według formuły: 


EA = M [AB + pb] + RI: SKALA + pi 


gdzie, jak łatwo zauważyć, adres jest obliczany w dwóch krokach. Najpierw jest obliczany 
adres miejsca w pamięci, dla odczytania przemieszczenia dla rejestru indeksowego. W tym 
celu dodaje się do zawartości rejestru bazowego AB wartość przemieszczenia pb. Po 
odczytaniu pamięci, do odczytanej zawartości komórki pamięci dodaje się zawartość 
rejestru indeksowego oraz przemieszczenia pi. 


Celem tworzenia takich struktur adresowania jest uzyskanie możliwości skrócenia 
długości rozkazów, przy zachowaniu elastyczności relokowania używanych struktur 
danych. 


PAMIĘCI. 


5.1. WPROWADZENIE 


Najważniejszymi parametrami specyfikowanymi dla pamięci są: 
l) pojemność, 
2) szybkość, 
3) koszt, 
4) pobór mocy. 


Pojemność pamięci (ang. capacity) określa ilość informacji jaką można w niej prze- 
chowywać. Mierzy się ją w jednostkach informacji takich jak: bity, bajty lub słowa. 
Pamięć jest podzielona na pewne fragmenty tak, aby różnym fragmentom odpowiadały 
różne adresy. W zależności od typu pamięci fragmenty te mogą mieć różną wielkość. 
W pamięci głównej (operacyjnej) komputera fragmenty odpowiadają zwykle długości 
słowa komputerowego i nazywane są komórkami. W mikrokomputerach stosuje się pamięci 
o długości słowa 8 lub 16 bitów. W większych komputerach długość słowa pamięci 
głównej osiąga 32 lub 64 bity. 


Pojemność pamięci operacyjnych określa się podając liczbę słów i długość słowa. 
Liczbę słów podaje się używając przedrostków odpowiadających odpowiednim 
mnożnikom jak np.: Kilo- (mnożnik 2' = 1024), Mega- (mnożnik 2”) lub Giga- (mnoż- 
nik 2”). Przykładowo pojemność pamięci może wynosić 512K x 64, co oznacza, że jest to 
2' słów 64-bitowych. W przypadku gdy słowo ma długość 8 bitów pojemność pamięci 
jest podawana w bajtach. Wówczas np. 128 KB oznacza 2'7 bajtów. 


W pamięciach masowych komputerów, których pojemności są większe od pojemności 
pamięci głównej, adresowanymi fragmentami nie są słowa, lecz zwykle większe obszary 
pamięci. Na przykład w pamięciach dyskowych fragmentem takim jest tzw. sektor, którego 
pojemność to zwykle setki a nawet tysiące słów. Żądanie dostępu do pamięci i podanie 


odpowiedniego adresu jej fragmentu pozwala na zapisanie lub odczytanie całego bloku 
słów. 


Szybkość pracy pamięci jest parametrem wskazującym na to, jak często procesor lub 
inne urządzenie może korzystać z niej. Jest ona określana kilkoma parametrami. Są to: 

— czas dostępu (ang. access time), 

— czas cyklu (ang. cycle time), 

— szybkość transmisji (ang. transfer speed). 


Czas dostępu jest to czas jaki upływa od momentu zażądania informacji z pamięci do 
momentu, w którym ta informacja ukaże się na wyjściu pamięci. Dla pamięci operacyjnych 
czas ten wynosi od 20 ns do 200 ns. 
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Czas cyklu jest to najkrótszy czas jaki musi upłynąć pomiędzy dwoma żądaniami 
dostępu do pamięci. Zwykle czas ten jest nieco dłuższy od czasu dostępu, a wynika to 
z fizycznej realizacji pamięci, tj. opóźnień wnoszonych przez układy elektroniczne. 


Szybkość transmisji mierzy się liczbą bitów (bajtów) jaką można przesłać w jednostce 
czasu pomiędzy pamięcią a innym urządzeniem. Parametr ten jest szczególnie ważny 
w pamięciach, w których adresowane są fragmenty większe niż słowo (np. pamięci dys- 
kowe). Ponieważ w takich pamięciach odczytuje się lub zapisuje bloki słów, to mniej 
istotny jest czas dostępu do pamięci, a bardziej istotny jest czas w jakim taka porcja 
informacji może zostać przesłana. Najczęściej szybkość transmisji mierzy się w bitach lub 
bajtach na sekundę. 


Nowe technologie pozwalają na ciągłe zmniejszanie kosztu produkcji pamięci i ulep- 
szanie ich parametrów. Dlatego pamięci dość szybko starzeją się, a często po paru latach 
są wycofywane z użytku. Taki los spotkał rdzeniowe pamięci ferrytowe, które w latach 
sześćdziesiątych dominowały jako pamięci operacyjne komputerów, a teraz nie są już 
spotykane. Najniższym kosztem, wsród pamięci operacyjnych komputerów, charakteryzują 
się pamięci półprzewodnikowe. Jednak one także różnią się między sobą pojemnością 
iszybkością działania, a co za tym idzie i ceną. Produkowane są tanie układy scalone 
pamięci półprzewodnikowych, ale charakteryzują się one niezbyt dużą szybkością dzia- 
łania. Natomiast szybkie układy pamięciowe mają niewielkie pojemności a cena ich jest 
stosunkowo duża. Dlatego poszukuje się nowych rozwiązań w architekturze komputerów, 
które pozwolą na optymalizację pracy komputerów, a w szczególności parametrów pamięci. 
Jednym ze stosowanych rozwiązań dla pamięci operacyjnych jest zastosowanie dwóch 
rodzajów pamięci półprzewodnikowych: pamięci szybkich, ale o mniejszej pojemności 
i pamięci wolniejszych, ale o dużych pojemnościach. Pamięci wolniejsze umożliwiają 
budowanie pamięci operacyjnych o dużych pojemnościach, a pamięci szybkie, o mniej- 
szych pojemnościach, umożliwiają przyspieszenie pracy. Szybka pamięć o niewielkiej 
pojemności współpracująca z pamięcią operacyjną jest nazywana pamięcią kieszeniową 
(ang. Cache memory). Współpraca tych dwóch rodzajów pamięci omówiono w dalszej 
części niniejszego rozdziału. 


Pobór mocy jest też ważnym parametrem, którego znaczenie uwypukla się przy 
budowaniu pamięci operacyjnych o bardzo dużych pojemnościach, gdzie istnieje problem 
połączenia dużej liczby układów scalonych i odprowadzenie wydzielanego ciepła. Innym 
przykładem konieczności dążenia do zmniejszania pobieranej mocy komputerów, a co za 
tym idzie i pamięci, są komputery kieszonkowe. 


Ponieważ konstruktorzy komputerów zmuszeni są do stosowania wielu rodzajów 
pamięci w jednym komputerze, to zwykle wprowadza się tzw. hierarchię pamięci. Na 
samej górze tej hierarchii znajdują się pamięci najszybsze, ale o najmniejszej pojemności. 
Wraz ze wzrostem pojemności pamięci szybkość ich maleje. Można wyróżnić 5 poziomów 
hierarchii pamięci: 

l) pamięć rejestrowa, 

2) pamięć kieszeniowa, 

3) pamięć operacyjna, 

4) pamięć masowa, 

5) pamięć zewnętrzna. 
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Pamięć rejestrowa jest to zbiór wszystkich, dostępnych rejestrów znajdujących się w pro- 
cesorze. Dostęp do nich jest możliwy poprzez układ sterowania, którego zadaniem jest 
wybranie odpowiedniego rejestru na podstawie kodu rozkazowego. Jest to pamięć o naj- 
szybszym dostępie, ale o najmniejszej pojemności. Pamięć kieszeniowa ma pojemności 
rzędu 100 Ksłów, a czas dostępu jest rzędu nanosekund. Pamięci operacyjne mają czasy 
dostępu rzędu 100 ns, ale ich pojemności przekraczają dziesiątki megasłów. Pamięci 
masowe to zwykle pamięci dyskowe, których pojemności przekraczają setki megasłów dla 
niewielkich mikrokomputerów i setki gigasłów dla dużych komputerów. Dla pamięci 
dyskowych wyznacza się tzw. średni czas dostępu (czas dostępu zależy od momentu 
zażądania dostępu). Wielkość tego parametru zależy od szybkości obrotów dysków i wy- 
nosi kilka milisekund. Jeśli szybkość obrotowa wynosi 3000 obr/min (szybkość odpowia- 
dająca 50Hz), to średni czas dostępu wynosi 10 ms. W przypadku pamięci zewnętrznych 
(pamięć na taśmach magnetycznych lub na wymiennych dyskach) najważniejszą ich cechą 
jest możliwość wymiany nośnika. Duże zbiory informacji są pamiętane na wielu nośnikach, 
które są przechowywane poza komputerem. W razie potrzeby w danym momencie zakłada 
się do napędu tylko wybrane nośniki. Dla pamięci zewnętrznych najważniejszym para- 
metrem jest szybkość transmisji. 


Pamięci można podzielić także pod względem sposobu dostępu do informacji. Wyróż- 
nia się cztery klasy pamięci: 

1) pamięci z dostępem bezpośrednim (swobodnym), 

2) pamięci z dostępem cyklicznym, | 

3) pamięci z dostępem sekwencyjnym, 

4) pamięci z dostępem asocjacyjnym. 


Matryca 
2'xm 


Rysunek 5.1. Schemat pamięci RAM 


Pamięci z dostępem swobodnym, inaczej pamięci RAM (ang. random access memory) są 
pamięciami matrycowymi, gdzie nośnikiem informacji jest matryca elementów. Pamięci 
z dostępem swobodnym można podzielić na pamięci ROM (ang. read only memory), które 
są tylko jeden raz zapisywane, a następnie tylko odczytywane i pamięci RAM wielokrotnie 
zapisywane i wielokrotnie odczytywane. Poszczególne elementy matryc pamięciowych 
pamiętają jeden bit. Na rysunku 5.1 przedstawiono ogólny schemat pamięci z dostępem 
swobodnym o pojemności 2" x m. Współpraca procesora z przykładową pamięcią odbywa 
się w ten sposób, że procesor wysyła n-bitowy adres i dwa stroby: sygnał dostępu E 
isygnał rodzaju pracy R/W (odczyt-zapis, ang. read/write). Wejściowy dekoder adresu 
zostaje odblokowany sygnałem dostępu E i następuje cykl pracy pamięci. W zależności od 
wysterowania linii R/W będzie to cykl odczytu lub cykl zapisu pamięci. 


00 5. Pamięci 


Pamięci z dostępem cyklicznym można podzielić na dwie grupy: pamięci z 
nieruchomym nośnikiem i pamięci z ruchomym nośnikiem. Do pierwszej grupy należą 
pamięci, wykorzystywane tylko w specjalnych zastosowaniach, zbudowane na rejestrach 
przesuwających, gdzie informacja krąży zamknięta w pętli sprzężenia zwrotnego. Odczytu 
dokonuje się na wyjściu ostatniego stopnia, a zapisu na wejściu pierwszego stopnia 
(logicznie jest to ten sam punkt). Do drugiej grupy należą kinetyczne pamięci 
magnetyczne, tj. pamięci dyskowe. 


Adres 


j Rejestry 
przesuwające 


Rysunek 5.2. Schemat pamięci z dostępem cyklicznym 


Na rysunku 5.2 pokazano ogólny schemat pamięci z dostępem cyklicznym. Adres 
podawany jest na wejście komparatora, który porównuje go z tzw. adresem bieżącym, 
tj. adresem generowanym przez pamięć i wskazującym miejsce w pamięci, które w tym 
momencie może zostać odczytane lub zapisane. W momencie uzyskania zgodności 
następuje odczyt albo zapis do pamięci, w zależności od stanu na linii RW. 


Pamięci z dostępem sekwencyjnym są pamięciami na taśmach magnetycznych. W ta- 
kich pamięciach informacja zapisywana jest w kolejności jej przychodzenia. Porcja danych, 
nazywana blokiem lub rekordem, jest zapisywana sekwencyjnie, tj. kolejno jedna za drugą 


na całej długości taśmy. Odczytu dokonuje się podając numer rekordu liczony od początku 
taśmy. | 


Pamięci asocjacyjne (ang. associative memory) są czasem nazywane pamięciami 
adresowanymi zawartością (ang. content addressable memory) lub pamięciami skojarze- 
niowymi. Działanie tej pamięci jest złożeniem funkcji pamięci RAM i dodatkowej funkcji 
przeszukiwania zawartości pamięci. Sposób wykorzystania tej funkcji podany zostanie 
w dalszym ciągu tego rozdziału. 


5.2. PAMIĘCI OPERACYJNE 


5.2.1. RODZAJE PAMIĘCI OPERACYJNYCH 


W niniejszym podrozdziale przedstawiono dwie klasyfikacje pamięci stosowanych jako 
pamięci operacyjne. Pierwsza z nich dotyczy różnych sposobów wybierania (uaktywniania) 
elementów z matryc, a druga technologii wykonania. 


Pierwsza klasyfikacja wynika z faktu stosowania elementów pamięci RAM o różnej 
liczbie końcówek. Końcówki te to: wejście do zapisywania bitu, wyjście do odczytywania 
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zawartości (niekiedy wejście i wyjście stanowi jedna linia) i końcówki do uaktywniania 
elementu (wybierania). Ze względu na liczbę końcówek wybierających elementy pamięci 
dzielą się na: elementy z jednym wejściem wybierania i elementy z dwoma wejściami 
wybierania. Element pamięci z jednym wejściem jest prostszy, ale pamięć zbudowana z 
takich elementów wymaga bardziej rozbudowanego układu wybierania. 


"EE 


wejścia | 
wyberające 


linie danych 


Rysunek 5.3. Pamięć typu 2D: a) matryca i b) układy współpracy 


Element z jednym wejściem wybierania jest wybrany, gdy na końcówce wybierania 
jest odpowiedni sygnał (np. logiczna 1). Wówczas można dokonać odczytu lub zapisu. Na 
rysunku 5.3a pokazano 16 elementów z jedną końcówką wybierania, ułożonych w matrycę 
4 x 4. Są one połączone w taki sposób, że wejścia wybierania elementów znajdujących się 
w tym samym wierszu są połączone i końcówki danych (zakładamy, że wejście i wyjście 
stanowią jedną linię) elementów znajdujących się w tej samej kolumnie są połączone. Na 
rysunku 5.3b przedstawiono organizację pamięci zbudowanej z wykorzystaniem takiej 
matrycy. Na wyjściu dwuwejściowego dekodera pojawia się słowo kodu „1 z4” i w ten 
sposób wybierany jest tylko jeden z czterech wierszy, tj. jedna z 4 komórek pamięci. 
Każda komórka składa się z 4 elementów. Każda końcówka danej kolumny jest dołączona 
do wyjścia wzmacniacza zapisu i wejścia wzmacniacza odczytu. Wzmacniacze są stero- 
wane sygnałem R/W, który powoduje ich naprzemienną pracę, tj. wzmacniacz zapisu 
pracuje w cyklu zapisu, a wzmacniacz odczytu w czasie cyklu odczytu. 


Pamięć zawierająca elementy z jednym wejściem wybierania jest nazywana pamięcią 
z wybieraniem liniowym lub pamięcią typu 2D (ang. dimension). Wadą tego rozwiązania 
jest konieczność rozbudowywania dekodera wejściowego wraz ze wzrostem pojemności 
pamięci. Wielkość dekodera rośnie bardzo szybko wraz z liczbą komórek pamięci. Przy- 
kładowo dla pamięci o pojemności 64 K (długość słowa nie odgrywa w tym przypadku 
żadnej roli) dekoder jest 16-wejściowy i aż 2'5-wyjściowy. Technologicznie wykonanie 
takiego dekodera jest trudne. Wadę tę można wyeliminować stosując elementy pamięci 
o dwóch wejściach wybierania działających w taki sposób, że element jest aktywny 
wówczas, gdy na obu wejściach są odpowiednie sygnały (np. logiczne 1). Pamięć wy- 
korzystująca takie elementy jest nazywana pamięcią typu 3D. 


7 — Podstawy budowy i działania komputerów 
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Rysunek 5.4. Pamięć typu 3D: a) matryca i b) układy współpracy 


Na rysunku 5.4a pokazano matrycę 16 elementów z dwoma wejściami wybierania, 
przy czym zaznaczono połączenia tylko końcówek wybierania. Końcówki danych są 
zwarte dla wszystkich elementów, co powoduje, że matryca tworzy pamięć 16 słów 
jednobitowych. Aby wybrać dane słowo trzeba wybrać jeden z wierszy i jedną z kolumn. 
Można to zrobić za pomocą dwóch 2-wejściowych dekoderów. Na rysunku 5.4b pokazano 
organizację pamięci o pojemności 16 x 4. Każdy „płat? pamięci jest matrycą 4 x 4, jak na 
rysunku 5.4a. Końcówki danych (wejścia i wyjścia danych wszystkich elementów na 
jednym płacie są zwarte) są dołączone do wejść wzmacniaczy odczytu i wyjść wzmac- 
niaczy zapisu. Elementy pamięci wraz z dwoma dekoderami wejściowymi tworzą dekoder 
matrycowy (por. rozdz. 3). Rozwiązanie to znacznie upraszcza budowę pamięci. Przy- 
kładowo dla pamięci o pojemności 64 K trzeba zastosować dwa dekodery 8-wejściowe 
o 2* wyjściach. Jest to prostsze rozwiązanie niż dla pamięci typu 2D o takiej samej po- 
jemności. Tam dekoder wymagał 2' bramek, podczas gdy dla pamięci 3D trzeba 2? 
bramek. Ponadto bramki dekodera 2D są 16-wejściowe, a bramki dekodera 3D są tylko 
8-wejściowe. Ten zysk został okupiony wydłużeniem czasu dekodowania, ponieważ są 
dwa stopnie dekodowania. Pewnym kompromisowym rozwiązaniem jest pamięć ty- 
pu 2%4D. 


Zasada pracy pamięci 2'4D polega na tym, że w matrycy stosuje się elementy z jedną 
końcówką wybierania, tak jak w pamięci typu 2D, ale odczytu lub zapisu dokonuje się 
tylko z wybranych kolumn. Niech będzie dana matryca jak na rysunku 5.3a, która pracuje 
w układzie jak na rysunku 5.5a. Linie kolumn tej matrycy są multipleksowane (w roz- 
dziale 3 nie był omawiany układ dwukierunkowego multipleksera, ale elektroniczna jego 
realizacja jest łatwa). Multiplekser taki jest sterowany dwoma sygnałami adresowymi. 
W czasie cyklu pracy pamięci jest wybrany tylko jeden wiersz, ale także tylko jeden 
zelementów tego wiersza jest dołączany do końcówki danych (wejścia wzmacniacza 
odczytu albo wyjścia wzmacniacza zapisu). Wyboru kolumny dokonują sygnały na wejś- 
ciach sterujących multipleksera, czyli wejściach A, i A,. W ten sposób układ z rysunku 5.5a 
stanowi pamięć o pojemności 16 słów jednobitowych. 


W ogólnym przypadku, aby zbudować pamięć o pojemności 2" słów 2”-bitowych, 
tworzy się matrycę kwadratową o Vk wierszach i Vk kolumnach, gdzie k =2"x 2”. Jest to 
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Rysunek 5.5. Pamięć typu 22D 


możliwe, gdy n+m jest parzyste. Jeżeli n+m jest nieparzyste, to matryca musi być 
prostokątna. Na rysunku 5.5b pokazano organizację pamięci 2/D o pojemności 1K x 8. 
W tym przypadku n=l10 a m=3, więc matryca jest prostokątna. Liczba wierszy wynosi 
|=2/27”=128 a liczba kolumn k/l = 2 x 2” = 64. Kolumny są podzielone na 8 grup, po 
6 kolumn w każdej grupie. W takim przypadku trzeba zastosować 8 multiplekserów. 
Siedem bitów adresowych steruje dekoderem wybierając jeden spośród 128 wierszy, 
a pozostałe 3 bity adresowe sterują multiplekserami wybierając tylko jedną spośród 
8 kolumn danej grupy. 


Pamięci z wybieraniem typu 2D są szybkie, ale drogie (koszt dekodera), pamięci 
z wybieraniem 3D są wolniejsze, ale tańsze, a kompromisowe rozwiązanie pamięci z wy- 
bieraniem typu 2/4D ma dość złożoną organizację. 


Przedstawienie drugiej klasyfikacji pamięci, poprzedzi krótkie omówienie dwóch za- 
gadnień: jedno dotyczące niezawodności pracy pamięci i drugie dotyczące pamięci ROM. 
Pierwsze z nich dotyczy problemu błędów, które zdarzają się podczas pracy pamięci, 
a których przyczynami mogą być np. zbyt duże zmiany napięcia zasilającego lub zbyt 
duże natężenie promieniowania. W takich przypadkach mogą powstawać błędy trwałe 
(ang. hard errors) polegające na zmianie zawartości komórki pamięci lub też błędy 
przemijające (ang. sofł errors) polegające na jednokrotnym przekłamaniu powstałym przy 
odczycie zawartości. Celem zwiększenia niezawodności pamięci stosuje się układy de- 
tekcji i korekcji błędów. Jednym ze sposobów detekcji pojedynczego błędu jest dodanie 
do każdego słowa bitu parzystości i sprawdzanie jego wartości przy odczycie (problem ten 
przedstawiono w rozdz. 3). Korekcję błędów można uzyskać dopisując do każdego słowa 
w pamięci bity kodu CRC. Oczywiście przy takim rozwiązaniu potrzebna pojemność 
pamięci musi być zwiększona. 


Na rysunku 5.6 pokazano organizację pamięci z układem korekcji błędu. Dla każdego 
m-bitowego słowa wejściowego w układzie K1 są obliczane wartości k bitów kodu ko- 
rekcyjnego i w efekcie do pamięci jest zapisywanych m +k bitów. Podczas odczytu układ 
K2 oblicza wartości k bitów korekcyjnych dla słowa odczytywanego z pamięci, które to 
bity są porównywane z odczytanymi z pamięci bitami korekcyjnymi. W przypadku nie- 
zgodności tych słów, na wyjściu komparatora, powstaje sygnał uruchamiający układ ko- 
rekcji K3. Zadaniem tego układu jest obliczenie numeru pozycji, na której nastąpiło 
przekłamanie i dokonanie korekcji tej wartości. 
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Rysunek 5.6. Układ korekcji błędów w pamięci RAM 


Drugie sygnalizowane zagadnienie dotyczy pamięci stałych ROM. Najczęściej używa- 
nymi pamięciami ROM są układy PROM (ang. programmable ROM). Zawartość takiego 
układu jest jednokrotnie zapisywana (programowana) przez użytkownika i w czasie eks- 
ploatacji systemu jest tylko odczytywana. Matryce tych pamięci zawierają proste elementy 
półprzewodnikowe (np. tranzystor). Pamięci są budowane w postaci układu scalonego 
w technologii HMOS lub CHMOS. Pojemności takich układów sięgają jednego miliona 
bitów, a najczęściej przyjętą długością słowa jest bajt. Czas dostępu takich pamięci waha 
się od 100 ns do 200 ns, ale istnieją także szybsze, choć droższe, pamięci do specjalnych 
zastosowań. Pobierany prąd zasilania układu scalonego pamięci PROM waha się od 
50 mA do 150 mA, co w przypadku projektowania dużych bloków pamięci może dać 
znaczną moc. Dlatego często pamięci wyposaża się w mechanizm pozwalający na tzw. stan 
wyłączenia (ang. standby power). Polega to na wprowadzeniu możliwości ustawienia 
takiego stanu układu, że gdy chwilowo on nie pracuje (nie ma cyklu odczytu ani zapisu), 
to wówczas pobiera znacznie zmniejszoną moc. Spada ona nawet 100-krotnie w stosunku 
do mocy pobieranej w czasie pracy. Taki tryb pracy wprowadza się także w pamięciach 
zapisywalnych. 


W komputerowych systemach prototypowych stosuje się pamięci stałe z możliwością 
wymazania zawartości i ponownego zapisania. Stosowane są dwa rodzaje pamięci wy- 
mazywalnych: pamięci kasowane promieniowaniem ultrafioletowym UVEPROM i pamięci 
kasowane elektrycznie EEPROM (E'PROM). Proces wymazywania zawartości jest długo- 
trwały (rzędu milisekund). 


Wadą pamięci półprzewodnikowych RAM jest to, że jest ona ulotna, tj. jej zawartość 
jest tracona po wyłączeniu napięcia zasilania. Aby pamięć operacyjna (lub jej część) była 
nieulotna (ang. non-volatile) wyposaża się ją w układ bateryjny podtrzymujący napięcie 
po wyłączeniu napięcia głównego. Innym rozwiązaniem może być zastosowanie 
tzw. pamięci NVRAM. Jest to taka pamięć półprzewodnikowa, w której w jednej obudowie 
scalono pamięci RAM i EEPROM. W „normalnym trybie pracy pracuje tylko pamięć 
RAM, a pod wpływem odpowiedniego sygnału zewnętrznego zawartość tej pamięci jest 
przepisywana do pamięci EEPROM. 


Druga klasyfikacja pamięci dotyczy pamięci półprzewodnikowych RAM. Pamięci te 
można podzielić na dwie podstawowe grupy: pamięci statyczne SRAM (ang. static 
memory) i pamięci dynamiczne DRAM (ang. dynamic memory). Pamięci statyczne są to 
szybkie pamięci, ale o stosunkowo niewielkiej pojemności i dużym poborze mocy. 
Elementami takich pamięci są przerzutniki. Duży pobór mocy powoduje trudności ze 
zbudowaniem pamięci operacyjnej o dużej pojemności. Dlatego pamięci statyczne są 
stosowane tam, gdzie nie jest wymagana duża pojemność, a jedynie duża szybkość pracy. 
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Rysunek 5.7. Pamięć statyczna HM6116 


Przykładem takiego zastosowania jest pamięć kieszeniowa. Pamięci dynamiczne zaś skła- 
dają się z elementów, które nie są przerzutnikami, a specjalnymi układami elektronicznymi 
zawierającymi mniejszą liczbę elementów. Podstawowym elementem tych układów jest 
kondensator, którego stan naładowania wskazuje na wartość bitu. Pamięci dynamiczne 
charakteryzują się małym poborem mocy i stosunkowo dużą pojemnością. Wadą tych 
pamięci jest to, że informacja pamiętana jest jedynie przez krótki czas — typowo kilka 
milisekund (2,4, 8 ms). Po tym czasie zawartość pamięci musi zostać odświeżona 
(ang. refresh). 


Dalej przedstawiono budowę i sposoby współpracy z procesorem obu w/w typów 
pamięci. Na rysunku 5.7a pokazano strukturę przykładowego układu scalonego pamięci 
statycznej typu 2%D (jest to pamięć firmy Hitachi HM6116) o pojemności 2 KB. Sygnał 
dostępu do pamięci CS uaktywnia cały układ, sygnał WE otwiera bufor wejściowy (dla 
zapisu) i dezaktywizuje bufor wyjściowy, natomiast sygnał OE otwiera bufor wyjściowy. 
Jeśli CS = 1, to układ jest wyłączony (standby power) i pobierany prąd spada z 80 mA do 
15 mA. Dalszą redukcję pobieranej mocy można osiągnąć, zwiększając poziom sygnału 
CS odpowiednio blisko napięcia zasilania i wejściowe sygnały danych sprowadzając bądź 
do napięcia zasilania, bądź do masy. Pobierany prąd może spaść do ok. 2 mA. Cykl pracy 
pamięci przedstawiono na rysunku 5.7b. Zaczyna się on od podania adresu na linie adre- 
sowe. W cyklu odczytu po t,, = 120 ns odczytywane słowo może ukazać się na wyjściu, 
jeśli sygnały CS i OE staną się aktywne w odpowiednim czasie. Jak widać na rysun- 
ku 5.7b, dopiero po czasie ty, od momentu pojawienia się sygnału OE i po czasie YA 
od momentu pojawienia się sygnału CS, na wyjściu buforów danych pojawia się odczytane 
słowo. Wynika to z czasu jaki musi upłynąć, aby układy buforów przeszły ze stanu 
wysokiej impedancji w stan aktywny. Podobne zjawisko występuje na końcu cyklu, gdzie 
bufory zostają wprowadzane w stan wysokiej impedancji. Tam powstaje tzw. zjawisko 
przeciągania, tj. podtrzymywania danych na wyjściu bufora o czas tby po zmianie adresu. 
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Adres >< ADR. WER. X ADR. KOL. OX 
Matryca 


256 x 256 RAS | | m 


DIN 


Rysunek 5.8. Pamięć dynamiczna HM4864 


Wydłuża to czas cyklu pamięci. W czasie zapisu pojawia się strob WE, który ma pojawić 
się nie wcześniej niż po czasie t,s po zmianie adresu, ma trwać co najmniej przez czas ty, 
i musi skończyć się o czas tą przed zmianą adresu. Te zależności czasowe określają 
minimalny czas cyklu pamięci. 


Innym rodzajem pamięci półprzewodnikowej są pamięci dynamiczne, które wymagają 
bardziej skomplikowanego sterowania, co wynika z zasady działania tych pamięci. Na 
rysunku 5.8a pokazano schemat pamięci dynamicznej firmy Hitachi HM4864 o pojemności 
64K x 1, czasie cyklu 125 ns i poborze prądu zasilania 55 mA, a w stanie nieaktywnym 
3,5 mA. Matryca pamięci składa się 256 wierszy 1 256 kolumn i jest pamięcią typu 2%D. 
Z rysunku 5.8a widać, że multipleksowanie kolumn odbywa się z wyjść układów 
wzmacniaczy regeneracji zwanych inaczej rejestrem odświeżania, gdyż układ ten pełni 
obie funkcje. W czasie cyklu odczytu cały wybrany wiersz z matrycy jest przepisywany do 
rejestru odświeżania i po zapisaniu wybranego bitu do bufora wyjściowego, jego cała 
zawartość jest ponownie zapisywana do wybranego wiersza matrycy. W ten sposób 
regeneruje się zawartość tego wiersza. Ponieważ czas odczytu wiersza jest względnie 
długi, więc numer bitu w wierszu (tzw. adres kolumny) jest wykorzystywany później niż 
adres wiersza. Pozwala to na podzielenie adresu na dwie części i podawanie ich 
sekwencyjne. Pierwsza część adresu wybiera odpowiedni wiersz w matrycy, a druga 
odpowiedni bit przez multipleksowanie wyjść wzmacniaczy regeneracji. Umożliwia to 
zmniejszenie liczby końcówek układu scalonego pamięci. Przykładowy układ pamięci ma 
tylko 8 wejść adresowych zamiast 16. 


Na rysunku 5.8b pokazano uproszczone przebiegi czasowe podczas cyklu pracy 
pamięci. Pierwsza część adresu (8 bitów — ADR WIER) jest ładowana do rejestru wierszy 
w czasie strobu RAS. Po tym jak wybrany wiersz zostanie zapisany do wzmacniaczy 
regeneracji, druga część adresu jest podawana na wejścia sterujące multipleksera w czasie 
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strobu CAS (ADR KOL) i wybiera odpowiedni bit z tego rejestru. Jeżeli jest to cykl 
odczytu, to bit ten zostaje przepisany do bufora wyjściowego. Jeżeli jest to cykl zapisu, to 
na wejście WE musi zostać podany strob zapisu i wartość z bufora wejścia-wyjścia BUF 
zostanie zapisana na odpowiednią pozycję wzmacniaczy regeneracji. Z opisu wynika, że 
odczyt wiersza lub jego zapis powodują regenerację jego zawartości w pamięci. W czasie 
pracy pamięci w systemie komputerowym nie ma gwarancji, że każdy wiersz wybrano co 
wymagany czas (np. 2 ms). Dlatego układ sterowania pamięcią musi zapewnić co 2 ms 
przerwanie współpracy pamięci z procesorem i dokonanie odświeżenia jej zawartości. 


Proces odświeżania pamięci może być wykonywany na różne sposoby. Kolejne wiersze 
matrycy mogą być odświeżane naprzemiennie z pracą procesora lub można dokonać 
odświeżenia wszystkich wierszy (całej pamięci) jednorazowo. Pierwszy sposób może 
okazać się lepszy w systemach czasu rzeczywistego, tj. tam gdzie jednorazowe zatrzymanie 
procesora na dłuższy czas jest niedopuszczalne. Dla drugiego sposobu czas odświeżania 
jest iloczynem liczby wierszy i czasu cyklu pamięci. Dla przykładowej pamięci czas ten 
wynosi 256 x 125 ns = 32 Hs, co stanowi 1,6% czasu pracy bez odświeżania, tj. 2 ms. Jeśli 
czas wykonywania programu jest dłuższy niż 2 ms, to zostanie on wydłużony średnio 
o 1,6%. Jeśli czas wykonania jakiegoś programu jest krótszy niż 2 ms, to efektywny czas 
jego wykonania zależy od momentu jego rozpoczęcia. Jeżeli wykonywanie programu 
rozpocznie się tuż po zakończeniu odświeżania, to będzie on wykonany bez przerwy. 
W innym przypadku będzie on przerwany i jego efektywny czas wykonania będzie 
zwiększony o 32 Hs. Współczesne pamięci dynamiczne są wyposażone w mechanizmy 
realizujące różne tryby procesu odświeżania zawartości. Ich celem jest przyspieszanie 
pracy pamięci przez skrócenie cyklu regeneracji. Opisane będą 4 takie tryby: 

l) normalny, 

2) wierszowy, 

3) statyczny, 


4) ukryty. 


Tryb normalny polega na zwykłym odczytywaniu poszczególnych wierszy, co jak już 
powiedziano, regeneruje ich zawartość. 


Tryb wierszowy (ang. RAS only) polega na podawaniu tylko adresów wierszy i stro- 
bów RAS. Ponieważ w czasie odświeżania nie trzeba odczytywać zawartości wzmacniaczy 
regeneracji, więc podawanie adresów kolumn i strobu CAS jest niepotrzebne. W czasie 
cyklu regeneracji zmieniają się adresy wierszy, a wyjścia pamięci utrzymywane są w sta- 
nie wysokiej impedancji, czyli są odłączone od pozostałych układów. 


Iryb statyczny realizuje się przez wyprzedzenie strobu RAS względem CAS 


wcześniej niż strob RAS, to dokona automatycznego odświeżania całej pamięci. Aby 


zrealizować taki tryb, pamięć musi być wyposażona w wewnętrzny licznik wierszy, który 
zapewni pojawienie się adresów wszystkich wierszy. 


Tryb ukryty (ang. hidden) jest podobny do trybu normalnego z tą różnicą, że na 
wyjściu informacyjnym nie zmieniane są sygnały danych. Inicjalizacja tego trybu polega 
na tym, że pierwszy cykl jest normalnym trybem odczytu, a następnie każdorazowa 


zmiana RAS powoduje wybranie następnego wiersza. 


96 


5. Pamięci 


We współczesnych pamięciach dynamicznych cykle dostępu realizowane są także 
w różnych trybach pracy. 


1) 


2) 


3) 


4) 


Tryb, który polega na sekwencyjnym przesłaniu adresu wiersza a następnie ko- 
lumny, nazywa się trybem normalnym. 

Tryb pracy polegający na tym, że jednorazowe wybranie wiersza matrycy 
umożliwia wielokrotny odczyt różnych kolumn jest nazywany trybem stronico- 
wania (ang. page mode). Nazwa bierze się stąd, że ułatwia on sposób dzielenia 
pamięci operacyjnej opisany w rozdz. 7. Dopóki stan na wejściu RAS jest 
aktywny, to podanie wielokrotnie strobu CAS spowoduje odczyt tej kolumny, 
której adres znajduje się na wejściu adresowym. 

Tryb statycznego odczytu kolumn (ang. staticzcolumn mode) jest podobny do 
trybu stronicowania. Różni się on od poprzedniego tym, że zarówno RAS jak i 
CAS pozostają nie zmienione, a każdorazowa zmiana adresu kolumny, w czasie 
gdy oba wymienione stroby są aktywne, powoduje jej odczytanie. 

Tryb lokalny (ang. nibble mode) polega na tym, że dokonuje się odczytu jak 
w trybie normalnym, a następnie utrzymując aktywny RAS można dokonać kilku 
(np. 4) zmian CAS, co spowoduje, że adres kolumny będzie inkrementowany 
ibędą odczytywane kolejne komórki pamięci (np. 4 sąsiednie). Tryb ten jest 
szczególnie wygodny, gdy pobiera się rozkazy (lub argumenty) dłuższe niż słowo 
maszynowe. 


5.2.2. ORGANIZACJA PAMIĘCI OPERACYJNYCH 


Projektowanie bloków pamięci polega na łączeniu wielu jednakowych pamięciowych 
układów scalonych (np. układów pamięci dynamicznej) i odpowiednim ich wysterowaniu. 
Połączenie ma na celu zwiększenie pojemności pamięci. Na rysunku 5.9a przedstawiono 
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A5 


= mad 


Rysunek 5.9. Sposoby łączenia układów pamięciowych 
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sposób rozszerzania liczby bitów, a na rysunku 5.9b rozszerzania liczby słów. Pokazano to 
na przykładzie łączenia 4 układów pamięci o pojemności 16 słów 4-bitowych każda. 
Z rysunków wynika, że zwiększanie liczby słów wymaga zastosowania dodatkowego 
układu dekodera. Do wejść dekodera są dołączane linie adresowe i w ten sposób zapewnia 
się, że w czasie jednego cyklu pamięci aktywny jest tylko jeden z czterech układów. 


1 
AO-A10 8 
GE1 HM 6117 
ka 2 KB 
WE 


A13 A14 E 


Rysunek 5.10. Blok pamięci statycznej 


Na rysunku 5.10 przedstawiono blok pamięci o pojemności 32 KB zbudowany z kostek 
(układów scalonych) pamięci statycznej firmy Hitachi HM6117 o pojemności 2 KB. Kostki 
te są wyposażone w dwa wejścia dostępu CE1 i CE2 (rys. 5.10a), co pozwala na prostszą 
realizację dekodowania (por. rozdz. 3). Matryca 4 x 4 jest sterowana (rys. 5.10b) z dwóch 
dekoderów 2-wejściowych. Wszystkie wejścia adresowe A0—A10 układów pamięci, linie 
wejścia-wyjścia dla danych i stroby WE są zwarte. Zwarte wejścia CE1 w każdym 
wierszu matrycy są sterowane z wyjść jednego dekodera, a zwarte wejścia CE2 w każdej 
kolumnie matrycy są sterowane z wyjść drugiego dekodera. Czas cyklu takiej pamięci 
wydłuża się w stosunku do katalogowego czasu dostępu układów pamięciowych, ponieważ 
dochodzi dodatkowe opóźnienie wnoszone przez dekodery. 


Do budowy pamięci o większych pojemnościach są stosowane układy pamięci dyna- 
micznych. Na rysunku 5.1la pokazano końcówki układu pamięci dynamicznej HM4816 
o pojemności 16 Kbitów, a na rys. 5.11b blok pamięci o pojemności 64 KB. Połączono 32 
układy tak, że zwarto wejścia adresowe i wejścia sterujące WE (ze względu na przej- 
rzystość rysunku nie pokazano tego). Siedem wejść adresowych musi być sterowanych 
z multipleksera, który zapewni dołączenie bloku do 14 linii magistrali adresowej. Pozostałe 
dwa bity adresowe A14 i A15 są podawane na wejścia dekodera sygnałów RAS. Wyjścia 
dekodera wybierają jeden z 4 banków pamięci sygnałami RAS. Natomiast wejścia i wyjś- 
cia informacyjne są zwarte w kolumnach. Na rysunku pokazano zwarcia wejść dla 
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Rysunek 5.11. Blok pamięci dynamicznej 


pierwszej kolumny (pierwszego bitu). Sygnały sterujące CAS są zwarte w jedną linię 
wejściową. 


Oprócz odpowiedniego wysterowania układów pamięciowych w bloku pamięci należy 
zapewnić także wykonanie innych funkcji pamięci, jak np. odświeżanie pamięci dyna- 
micznych. 


Na koniec tego podrozdziału przedstawiono cztery funkcje, które w niektórych roz- 
wiązaniach są realizowane przez bloki pamięci: 

1) ochrona przed utratą zawartości w przypadku zaniku napięcia zasilania, 

2) praca z przeplotem, 

3) pamięć dwubramowa, 

4) układowe wspomaganie systemu operacyjnego w zarządzaniu pamięcią. 


OCHRONA PRZED UTRATĄ ZAWARTOŚCI W PRZYPADKU ZANIKU NAPIĘCIA ZASILANIA 


W przypadku pamięci półprzewodnikowych może się zdarzyć, że w czasie pracy pamięci 
zaniknie napięcie zasilające, co może spowodować utratę zawartości pamięci. Aby tego 
uniknąć zasilacze wyposaża się w wyjście sygnalizujące zanik napięcia. Sygnał ten jest 
podawany do układu przerwań (por. rozdz. 6) jako przerwanie o najwyższym priorytecie. 
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Obsługa tego przerwania polega na zapamiętaniu stanu procesora i na włączeniu pod- 
trzymywania zasilania pamięci przez baterię. Alternatywnym rozwiązaniem jest wcześniej 
omówione zastosowanie pamięci NVRAM. 


PRACA Z PRZEPLOTEM 


Praca pamięci z przeplotem może znacznie przyspieszyć dostęp do niej, a jest możliwa 
wówczas, gdy blok pamięci składa się z kilku banków. W takim przypadku można zor- 
ganizować współpracę procesora z pamięcią tak, aby nie czekał on na dostęp do pamięci. 
Polega to na tym, że rozpoczyna się dostęp do banku i+1 zanim zakończy się cykl dostępu 
do banku o numerze i. Podobnie rozpoczyna się dostęp do banku 1+2 zanim zakończy się 
dostęp do banku i+1 itd. Wymaga to sekwencyjnego uaktywniania banków i multi- 
pleksowania wyjść danych z każdego banku. 


PAMIĘĆ DWUBRAMOWA 


Praca wielobramowa jest wykorzystywana w systemach wieloprocesorowych. Często 
zachodzi tam konieczność dostępu do pamięci z dwóch lub więcej magistral. Jeżeli dostęp 
ma być z dwóch magistral, to pamięć musi być wyposażona w podwójne wejścia adresowe, 
podwójne wejścia sterujące i podwójne wejścia danych, a ponadto w układ arbitrażu 
określający, która magistrala ma otrzymać dostęp w przypadku, gdy dostępu żądają obie. 
Istnieją kostki pamięci produkowane przez niektóre firmy, które mają wbudowane układy 
zapewniające pracę dwubramową. 


UKŁADOWE WSPOMAGANIE SYSTEMU OPERACYJNEGO W ZARZĄDZANIU PAMIĘCIĄ 


Układy wspomagające pracę systemu operacyjnego zwane są układami zarządzania 
pamięcią (ang. memory management unit MMU). Ich funkcje i zadania będą opisane 
w rozdz. 7. 


5.2.3. WSPÓŁPRACA PAMIĘCI OPERACYJNEJ Z PAMIĘCIĄ KIESZENIOWĄ 


Z poprzedniego podrozdziału wynika, że pamięci półprzewodnikowe RAM można po- 
dzielić na dwie klasy. Jedne to szybkie, ale o niewielkiej pojemności, drogie i pobierające 
dużą moc pamięci statyczne. Drugie to wolniejsze, ale o większej pojemności, tańsze 
i pobierające niewielką moc pamięci dynamiczne. Projektantom systemów komputerowych 
ten podział nasunął myśl jednoczesnego wykorzystania obu typów pamięci przy pro- 
jektowaniu pamięci operacyjnych. Do pamięci operacyjnej o dużej pojemności i zbu- 
dowanej z kostek pamięci dynamicznej można dodać stosunkowo niewielką, ale szybką, 
pamięć statyczną, pamiętającą jedynie fragment zawartości pamięci operacyjnej. Pomysł 
ten narodził się z badań związanych z tzw. zjawiskiem lokalności (ang. locality). Zjawisko 
to polega na tym, że kolejne odwołania do pamięci zachodzą zwykle w pewnym 
niewielkim obszarze. Obszar ten pokrywa się z miejscem ulokowania danego programu 
w pamięci i program rzadko odwołuje się do odległych obszarów. Dlatego jeśli obszar taki 
zostanie przepisany do niewielkiej, szybkiej pamięci, zwanej pamięcią kieszeniową 
(ang. cache memory), to istnieje duże prawdopodobieństwo, że najczęstsze odwołania 
podczas wykonywania tego programu będą do tej właśnie pamięci. Dlatego tak organizuje 
się współpracę procesora z pamięcią, aby odwołania procesora do pamięci dotyczyły 
jedynie pamięci kieszeniowej. Jeśli w czasie wykonywania programu procesor wyśle adres 
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obszaru znajdującego się w pamięci kieszeniowej, to mówimy o trafieniu. Natomiast jeśli 
procesor odwoła się do innego obszaru, to mówimy o chybieniu i wówczas trzeba zapewnić 
wymianę zawartości pamięci kieszeniowej. Ponieważ często po takim odwołaniu program 
wraca do poprzedniego obszaru, to tryb wymiany projektuje się w taki sposób, aby 
dotyczyła ona jedynie części pamięci kieszeniowej. 


Tablica 5.1. Porównanie szybkości i pojemności pamięci operacyjnych i pamięci kieszeniowych 


Komputer Data Czas Pamięć operacyjna Pamięć kieszeniowa 
prod. cyklu pojemn. czas cyklu pojemn. czas cyklu 
IBM 360/856 69 80 4M 960 32 80 
IBM 360/195 71 54 4M 756 32 54 
IBM 370/168 73 80 8M 400 16 80 
IBM 3033 78 57 8M 400 64 57 
IBM 3081 81 26 32M 312 32 26 
IBM 3090 85 18 128M 300/270 256 18 


W tablicy 5.1 zestawiono szybkości i pojemności pamięci operacyjnych i pamięci 
kieszeniowych dla kilku typów komputerów firmy IBM. Porównując szybkości działania 
widać, że cykl pracy pamięci kieszeniowej jest 5+15 razy krótszy od czasu cyklu pamięci 
operacyjnej. Czas trwania cyklu maszynowego komputera jest równy czasowi cyklu 
pamięci kieszeniowej. 


W niniejszym podrozdziale omówiono najpierw organizację pamięci kieszeniowej 
i kryteria doboru jej pojemności, a następnie współpracę pamięci operacyjnej z pamięcią 
kieszeniową. 


ORGANIZACJA PAMIĘCI KIESZENIOWEJ 


Niech będzie dana pamięć operacyjna o pojemności 2" słów podzielona na k bloków 
(rys. 5.12a) o pojemności q = 2'/k słów oraz pamięć kieszeniowa o pojemności m słów 
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Rysunek 5.12. Mapa pamięci operacyjnej (a) i kieszeniowej (b) 


5.2. Pamięci operacyjne 101 


zwanych dalej liniami (rys. 5.12b). W każdej linii pamięci kieszeniowej (ang. slof) ma być 
pamiętany jedeń blok pamięci operacyjnej wraz jego numerem, czyli etykietą (ang. tag). 
Długość linii pamięci kieszeniowej s wynosi wówczas s=8q+log,k słów. Niech 
przykładowa pamięć operacyjna ma pojemność 2'=64KB, a pamięć kieszeniowa 
m = 128. Jeśli założymy wielkość bloku q=8 bajtów, to liczba bitów w słowie pamięci 
kieszeniowej wyniesie 77, ponieważ w pamięci operacyjnej znajduje się k = 8192 bloków 
8-bajtowych i s=64+ 13. 


W danym momencie tylko m spośród k bloków (k >> m) rezyduje w pamięci kiesze- 
niowej i tylko one są dostępne dla procesora. Jeżeli procesor zażąda z pamięci operacyjnej 
słowa, którego nie ma w pamięci kieszeniowej (chybienie), to następuje wymiana 
zawartości tylko jednego bloku, tj. wymiana zawartości jednej komórki pamięci 
kieszeniowej. Przy projektowaniu pamięci kieszeniowej powstaje problem jej opty- 
malizacji. Zwykle sprowadza się go do określenia pojemności pamięci kieszeniowej mając 
znane czasy cyklu pamięci głównej i kieszeniowej. Pomocnym parametrem przy 
rozwiązywaniu tego zagadnienia jest współczynnik trafienia H (ang. hit ratio). Współ- 
czynnik ten oznacza prawdopodobieństwo, że odwołanie procesora do pamięci natrafi na 
adres w pamięci kieszeniowej. 


q = 64 


5 KB 10 KB 15 KB 20 KB Pojemność 
pamięci 
` kieszeniowej 


Rysunek 5.13. Zależność prawdopodobieństwa trafienia od pojemności pamięci kieszeniowej 


Na rysunku 5.13 pokazano zależność współczynnika H od pojemności pamięci kie- 
szeniowej. Badania wykonano dla minikomputera PDP-11. Z wykresu widać, że powyżej 
pewnej pojemności prawdopodobieństwo trafienia rośnie bardzo wolno. Stąd można 
wnioskować, że zwiększanie pojemności pamięci kieszeniowej powyżej pewnej granicy 
jest nieefektywne. 


Jaka jest zależność pomiędzy czasem dostępu do pamięci operacyjnej T, i czasem 
dostępu do pamięci kieszeniowej T_? 


Średni czas dostępu do pamięci można wyznaczyć biorąc: 
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Rysunek 5.14. Zależność pomiędzy czasem dostępu pamięci operacyjnej i pamięci kicszeniowej 


Dla danego T, : T, (np. 10) oraz założonego H = 0,8, z podanego wzoru można otrzy- 
mać, że T.: I. =0,35. Wartość T, :T, jest nazywana współczynnikiem efektywności 
dostępu. Zależność tego współczynnika od współczynnika H pokazano na rysunku 5.14. 
Z rysunku widać, że zakładając określoną wartość współczynnika efektywności i dane 
To: T, otrzymamy, że wartość współczynnika H nie powinna być zbyt mała. Dlatego 
z wykresu z rysunku 5.13 wynika, że pojemność pamięci kieszeniowej nie może być zbyt. 
mała. Do projektanta systemu należy znalezienie kompromisu pomiędzy wartościami tych 
współczynników dla danego stosunku czasów cyklu obu pamięci. 


WSPÓŁPRACA PAMIĘCI OPERACYJNEJ Z PAMIĘCIĄ KIESZENIOWĄ 


Niech będzie dana pamięć operacyjna o pojemności 2" = 64 KB i pamięć kieszeniowa 
o pojemności m = 128 linii po q = 8 bajtów. Przy projektowaniu pamięci kieszeniowej 
powstają trzy bardzo ważne zagadnienia: 

l) odwzorowanie obszarów pamięci operacyjnej i pamięci kieszeniowej, 

2) algorytmy wymiany zawartości pamięci operacyjnej i kieszeniowej, 

5) strategia aktualizacji zawartości pamięci kieszeniowej i pamięci operacyjnej. 


ODWZOROWANIE OBSZARÓW PAMIĘCI OPERACYJNEJ I KIESZENIOWEJ 


Do wzajemnego odwzorowania pamięci operacyjnej i pamięci kieszeniowej (ang. mapping) 
stosuje się najczęściej trzy metody: bezpośrednią, skojarzeniową i skojarzeniową zmody- 
fikowaną. 


Metoda bezpośrednia (ang. direct mapping) polega na przydzieleniu pewnego pod- 
zbioru bloków pamięci operacyjnej jednej linii pamięci kieszeniowej. Liczność tego 
podzbioru wynosi k:m (w naszym przykładzie 64). Tylko bloki tego podzbioru mogą być 
przepisywane do i z danej linii pamięci kieszeniowej. Każdy blok tego podzbioru ma 
swoją etykietę o długości log,(k/m), która dla naszego przykładu wynosi 6 bitów. Długość 
linii pamięci kieszeniowej wynosi zatem 70. Procesor odczytując pamięć kieszeniową 
sprawdza etykietę, która stanowi dla procesora wskaźnik mówiący o tym, który z przy- 
pisanych danej linii bloków znajduje się w pamięci. W naszym przykładzie każdemu 
blokowi pamięci kieszeniowej przypisuje się 8192:128 = 64 bloki w sposób pokazany 
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Rysunek 5.15. Przypisanie bloków pamięci operacyjnej blokom pamięci kieszeniowej metodą 
bezpośrednią 


na rysunku 5.15. Adres pamięci operacyjnej jest 16-bitowy i jest podzielony na trzy 
części: 

— 6 bitów etykiety, 

— 7 bitów adresu pamięci kieszeniowej, 

— 3 bity adresu słowa w bloku. 


Procesor porównując odczytaną z pamięci kieszeniowej etykietę z odpowiednią częścią 
adresu pamięci operacyjnej może stwierdzić trafienie lub chybienie. Jeśli nastąpiło chybie- 
nie, to należy dokonać wymiany zawartości tej linii pamięci kieszeniowej. Pamiętany blok 
zostaje zapisany do pamięci operacyjnej, a na jego miejsce wpisuje się blok z poszukiwaną 
etykietą. Wadą tej metody jest to, że każdy blok pamięci operacyjnej ma stałe miejsce 
w pamięci kieszeniowej, co w przypadku częstej wymiany bloków może prowadzić do 
spadku efektywności pracy pamięci. 


Metoda skojarzeniowa (ang. ussociative mapping) dopuszcza przypisanie każdemu 
blokowi dowolnej linii w pamięci kieszeniowej. Sposób odwzorowania jest zilustrowany 
na rysunku 5.16. Metoda ta wymaga wydłużenia etykiety do długości, która pozwoli na 
adresowanie wszystkich bloków w pamięci operacyjnej. W naszym przykładzie ma ona 
długość 13 bitów, a zatem całkowita długość linii pamięci kieszeniowej wynosi 77 bitów. 
W tym przypadku sprawdzenie zawartości pamięci kieszeniowej polega na odczycie 
wszystkich jej linii i sprawdzaniu czy blok z daną etykietą znajduje się w niej czy nie. Taki 
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Rysunek 5.16. Ilustracja metody skojarzeniowej 
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Rysunek 5.17. Układ pomocniczy sprawdzania zawartości pamięci kieszeniowej 


sposób kolejnego odczytywania poszczególnych komórek pamięci bardzo spowalniałby 


` jej pracę. Dlatego do celu stosuje się pamięć asocjacyjną i stąd nazwa metody. 


Na rysunku 5.17 pokazano układ sprawdzania zawartości pamięci kieszeniowej przy 
zastosowaniu pamięci asocjacyjnej. Pamięć asocjacyjna jest to pamięć RAM (w naszym 
przykładzie 128 słów 13-bitowych) wyposażona w dodatkowe wejścia przepytywania 
(w naszym przykładzie 13 — liczba ta jest równa długości słowa) i dodatkowe wyjścia 
odpowiedzi (w naszym przykładzie 128 — ich liczba jest równa liczbie słów w pamięci). 
Pamięć działa w taki sposób, że jeżeli na wejścia przepytywania zostanie podane słowo, to 
na wyjściach odpowiedzi pojawiają się: 

„l — jeśli w danej komórce znajduje się dane słowo, 

„0” — jeśli dana komórka zawiera inne słowo. 


Dlatego jeśli na wejścia przepytywania. podano numer bloku (13-bitowy), to pamięć 
odpowiada jedynką na tym wyjściu odpowiedzi, które odpowiada linii zawierającej ten 
numer. Na wyjściu pamięci asocjacyjnej pojawia się słowo w kodzie „1 z k”, które jest 
podawane na wejście kodera o 7 wyjściach adresujących pamięć kieszeniową. Jeśli jest 
chybienie, to na wyjściu pamięci asocjacyjnej są same zera i pamięć kieszeniowa nie jest 
odczytywana. 


Wadą tej metody jest trudność zaprojektowania układu sprawdzania zawartości pa- 
mięci kieszeniowej w przypadku, gdy jej pojemność jest stosunkowo duża. Powodem tego 
jest to, że cena pamięci asocjacyjnej rośnie szybko wraz z pojemnością. Wówczas można 
zastosować metodę odwzorowania zwaną zmodyfikowaną metodą skojarzeniową. 


Zmodyfikowana metoda skojarzeniowa (ang. set-associative mapping) pozwala na 
zastosowanie niewielkiej pamięci skojarzeniowej lub uniknięcia stosowania jej, nawet 
w przypadku, gdy pamięć kieszeniowa ma dużą pojemność. W metodzie tej dąży się do 
zmniejszania liczby linii pamięci kieszeniowej przez umieszczenie kilku bloków pod 
jednym jej adresem. Z daną linią pamięci kieszeniowej są kojarzone tylko pewne bloki 
pamięci operacyjnej (jak w metodzie bezpośredniej). Bloki te mogą być zapisywane na 
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Rysunek 5.18. Ilustracja zmodyfikowanej metody skojarzeniowej 
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dowolnym miejscu w danej linii pamięci kieszeniowej. Na rysunku 5.18 pokazano jak, dla 
naszego przykładu, można zrealizować pamięć kieszeniową umieszczając po dwa bloki 
pod jednym adresem pamięci kieszeniowej. W takim przypadku pojemność pamięci wynosi 
64 linie 142-bitowe. Liczba bitów w linii bierze się stąd, że jeden blok zawiera 71 bitów 
(dodatkowy bit jest przeznaczony na oznaczenie miejsca bloku w danej linii pamięci 
kieszeniowej). Dla naszego przykładu dowolność wymiany jest ograniczona jedynie do 
dwóch miejsc. Zaletą takiego rozwiązania jest możliwość wyeliminowania układu pamięci 
skojarzeniowej. 


ALGORYTMY WYMIANY ZAWARTOŚCI PAMIĘCI OPERACYJNEJ I KIESZENIOWEJ 


Algorytmy wymiany zawartości pamięci kieszeniowej stosowane są w przypadku, kiedy 
procesor żąda dostępu do komórki pamięci, która aktualnie nie znajduje się w pamięci 
kieszeniowej. W przypadku odwzorowania bezpośredniego, problem ten sprowadza się do 
wymiany zawartości odpowiedniej komórki pamięci. Dla pozostałych dwóch odwzorowań 
jest pozostawiony wybór bloku, który można usunąć i w to miejsce zapisać potrzebny 
blok. Wyboru dokonuje się stosując jeden z trzech algorytmów: 

1) Algorytm usuwania najdłużej nie używanego bloku — LRU (ang. least-recently 
used). Jest on stosowany wtedy, gdy odwzorowanie zrealizowano zmodyfikowaną 
metodą skojarzeniową, gdyż wówczas łatwo jest zaznaczać taki blok. W zależności 
od liczby bloków zapisanych pod jednym adresem pamięci skojarzeniowej dodaje 
się do bloku słowo o długości log,p, gdzie p jest liczbą bloków zapisanych pod 
jednym adresem w pamięci kieszeniowej. W naszym przykładzie p = 2, więc 
dodaje się jeden bit. Na początku pracy bit ten dla obydwu słów jest 0. Do bloku, 
do którego nastąpiło odwołanie, wpisuje się na tę pozycję jedynkę i jeśli w tym 
momencie ma nastąpić wymiana, to zachodzi ona dla bloku, dla którego bit ten 
jest równy 0. Jeśli natomiast, w czasie pracy procesora, nastąpi odwołanie do 
bloku, którego bit jest równy 0, to bit skojarzony z tym blokiem jest ustawiany 
w stan l, a zerowany jest bit drugiego bloku. W przypadku, gdy pod jednym 
adresem jest więcej bloków, to każde odwołanie do bloku ustawia wskażnik 
(dodatkowe słowo) w stan o jeden większy niż największy wskaźnik skojarzony 
z blokiem znajdującym się w tej komórce pamięci kieszeniowej. Jeśli któryś ze 
wskaźników osiągnie wartość maksymalną, to następne trafienia w dany blok 
powodują dekrementację wartości wskaźników w pozostałych blokach. Jeśli istnie- 
je kilka bloków z zerową wartością wskaźników, to usuwany jest przypadkowy 
blok. 

2) Algorytm FIFO (ang. first-in-first-out) powoduje usunięcie bloku, który najdłużej 
przebywa w pamięci kieszeniowej. W tym algorytmie każdy blok musi mieć 
dodatkowy wskaźnik, który wskazuje kolejność wpisywania bloków do danej 
komórki pamięci kieszeniowej. 

© 3) Algorytm najrzadziej używanego bloku LFU (ang. least-frequently used) polega 
na usuwaniu bloku, do którego było najmniej odwołań. W tym przypadku z każ- 
dym blokiem związany musi być licznik zliczający odwołania do danego bloku. 


STRATEGIA AKTUALIZACJI ZAWARTOŚCI PAMIĘCI KIESZENIOWEJ | PAMIĘCI OPERACYJNEJ 


Przyjęcie strategii aktualizacji zawartości pamięci kieszeniowej i pamięci operacyjnej jest 
konieczne z dwóch powodów: 


8 — Podstawy budowy i działania komputerów 


106 | 5. Pamięci 


l) zawartość pamięci kieszeniowej może zostać zmieniona w wyniku działania pro- 
gramu, podczas gdy odpowiadająca jej zawartość pamięci operacyjnej pozostanie 
nie zmieniona, 

2) zawartość pamięci operacyjnej może zostać zmieniona bądź w wyniku działania 
układu DMA, t. może zostać zapisana przez urządzenie zewnętrzne 
(por. rozdz. 6), bądź, jak w systemach wieloprocesorowych, przez inny procesor, 
podczas gdy zawartość pamięci kieszeniowej pozostanie nie zmieniona. 


Aby utrzymać koherentność pamięci trzeba aktualizować zawartości obu pamięci. Aktuali- 
zacji w obu pamięciach można dokonywać natychmiast po każdej zmianie. Taki sposób 
aktualizacji zawartości jest nazywany zapisem natychmiastowym (ang. write through). 
Wadą tej metody jest znaczne spowolnienie pracy pamięci. Jeśli w danym systemie jest to 
krytyczne, to można zastosować jedną z dwóch innych metod, a mianowicie: metodę 
powtórnego zapisu (ang. write back lub copy back) lub metodę natychmiastowej sygna- 
lizacji (ang. write once). Metoda powtórnego zapisu polega na tym, że do każdego bloku 
dołącza się jednobitowy wskaźnik aktualizacji (ang. update). Wskaźnik ten jest ustawiany 
w stan 1 wtedy, gdy do danego bloku nastąpił zapis. Podczas usuwania bloku z pamięci 
kieszeniowej sprawdza się wartość wskaźnika i jeśli jest on równy 0, to może zostać 
usunięty bez konieczności wymiany odpowiadającej mu zawartości pamięci operacyjnej. 
Jeśli natomiast wskaźnik jest równy 1, to przy wymianie bloku dokonuje się zapisu tego 
bloku do pamięci operacyjnej. 


Metoda natychmiastowej sygnalizacji jest stosowana w systemach wieloprocesoro- 
wych, gdzie do wspólnej magistrali i wspólnej pamięci (por. rozdz. 8) są dołączone pro- 
cesory z własnymi pamięciami kieszeniowymi. Metoda ta polega na tym, że każdy 
pierwszy zapis do danego bloku w pamięci kieszeniowej powoduje ustawienie 
odpowiedniego wskaźnika w stan 1 wraz z jednoczesnym aktualizowaniem pamięci 
operacyjnej. Następne zapisy nie powodują już takiej akcji, gdyż innym procesorom został 
zasygnalizowany fakt zmiany zawartości danego bloku. Natomiast podczas usuwania 
bloku z pamięci kieszeniowej jego zawartość jest zapisywana do pamięci operacyjnej, 
tylko gdy wskaźnik jest ustawiony w stan 1, natomiast w przeciwnym przypadku jest on 
tylko usuwany. 


5.3. PAMIĘCI Z DOSTĘPEM CYKLICZNYM 
5.3.1. WPROWADZENIE 


Pamięci z dostępem cyklicznym (ang. direct access memory) są wykorzystywane w kom- 
puterach jako pamięci masowe (lub niekiedy jako pamięci buforowe, tj. pośredniczące 
w wymianie danych pomiędzy dwoma urządzeniami). Pamięci masowe to najczęściej 
kinetyczne pamięci magnetyczne wykonywane jako pamięci dyskowe. Stosowane są 
najczęściej pamięci dwóch rodzajów: pamięci na twardym podłożu metalowym (ang. hard 
disk) 1 pamięci na podłożu elastycznym wykonanym z tworzywa sztucznego (ang. floppy 
disk). Pamięci buforowe budowane są czasem jako pamięci na rejestrach przesuwających. 


Zasada działania pamięci z dostępem cyklicznym polega na tym, że każda komórka 
pamięci jest dostępna dla otoczenia tylko w pewnym, określonym przez zegar, momencie. 
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Rysunek 5.19. Pamięć z dostępem cyklicznym 


Moment ten powtarza się okresowo i stąd nazwa rodzaju dostępu. Informacja na wejściu 
iwyjściu pamięci jest zwykle w postaci szeregowej. Na rysunku 5.19 pokazano ogólny 
schemat układu pamięci z dostępem cyklicznym. Nośnik informacji, oznaczony na rysunku 
przez PAM, jest sterowany przez generator zegara. W pamięciach dyskowych generatorem 
tym może być jedna ze ścieżek. Daje to dobre wyniki, ponieważ zapewnia właściwą 
synchronizację pamięci i układów z nią współpracujących nawet przy wahaniach obrotów. 
Wówczas sygnał zegarowy jest sygnałem wyjściowym bloku pamięci i dlatego na rysun- 
ku 5.19 połączenie bloku PAM i generatora zegara jest dwukierunkowe. W pamięciach na 
rejestrach przesuwających przebieg zegarowy jest podawany z zewnętrznego układu i jest 
on sygnałem wejściowym. Zegarowe impulsy taktujące są wykorzystywane w dwóch 
celach: 

— do wyznaczenia momentu odczytu lub zapisu informacji, 

— do zamiany postaci informacji z szeregowej na równoległą lub odwrotnie. 


Zakładając, że układ z rysunku 5.19 jest pamięcią buforową można przyjąć, że blok PAM 
jest pamięcią na rejestrach przesuwających. Moment odczytu i zapisu jest wyznaczany na 
podstawie adresu podawanego na wejście rejestru adresowego RA. Zawartość tego rejestru 
jest cały czas porównywana z zawartością licznika słów LS, którego zawartość zmienia się 
co jedno słowo. Ponieważ jeden takt zegara odpowiada czasowi trwania jednego bitu 
i długość licznika bitów LB jest równa długości słowa, to na wyjściu licznika bitów 
pojawia się impuls co jedno słowo. W momencie uzyskania zgodności zawartości rejestru 
RA i zawartości licznika LS można dokonać odczytu lub zapisu. W czasie zapisu słowo 
wejściowe (Dane zapisywane) jest ładowane do rejestru wejściowego, a w czasie odczytu 


zawartość rejestru wyjściowego jest odczytywana (Dane wyjściowe) w czasie strobu 
odczytu. 


Inaczej jest zorganizowana pamięć masowa, gdy blok PAM jest pamięcią dyskową. 
Jak podano w rozdz. 2 w pamięciach dyskowych adresowana jest zwykle większa porcja 
informacji niż jedno słowo. Najczęściej jest to blok (przeciętnie 64--4096 słów), który 
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stanowi tzw. sektor. Dlatego jeżeli schemat z rys. 5.19 ma przedstawiać pamięć dyskową, 
to trzeba uzupełnić go o jeszcze jeden licznik. Jest to licznik sektorów o długości równej 
liczbie sektorów. Licznik ten jest sterowany z wyjścia licznika słów. Dopiero zawartość 
tego licznika jest porównywana z zawartością rejestru adresowego. 


Zamiana postaci równoległej na szeregową odbywa się w wejściowym rejestrze prze- 
suwającym. Słowo wejściowe jest równolegle zapisywane do tego rejestru w momencie 
zgodności adresu z zawartością licznika słów. Następnie, zgodnie z taktami zegara, słowo 
wejściowe jest przesuwane w rejestrze i podawane na wejście pamięci. W czasie odczytu 
dokonywana jest zamiana postaci informacji z szeregowej na równoległą. Informacja 
z wyjścia pamięci jest szeregowo zapisywana do rejestru wyjściowego i jest w nim prze- 
suwana. W momencie zgodności adresu z licznikiem słów powstaje strob odczytu i słowo 
z tego rejestru może zostać odczytane równolegle. W przypadku pamięci dyskowych, gdy 
adresowany jest sektor, to ładowanie rejestru wejściowego i odczytywanie rejestru wyjścio- 
wego odbywa się zgodnie z przepełnieniem licznika bitów. Impuls przepełnienia tego 
licznika wskazuje na momenty czasu, kiedy rozpoczyna się odczyt lub zapis nowego 
słowa. Zadaniem układów współpracujących z pamięcią jest zapewnienie odpowiedniego 
podawania bloków słów na wejście pamięci lub odpowiednie odbieranie słów z jej wyjścia. 
Długość bloku jest równa długości sektora. Kolejne słowa muszą być podawane do rejestru 
wejściowego lub odbierane z rejestru wyjściowego z szybkością wyznaczoną przez zegar. 


5.3.2. PAMIĘCI DYSKOWE 


Pamięci dyskowe zbudowane są w ten sposób, że na cylindrycznych powierzchniach 
(talerz aluminiowy w przypadku dysków twardych i krążek folii poliestrowej w przypadku 
dysków elastycznych) jest naniesiona warstwa materiału magnetycznego, z którą współ- 
pracuje głowica odczytująco-zapisująca (rys. 5.20a). W czasie zapisu kierunek prądu 
w głowicy powoduje odpowiednie przemagnesowanie materiału, co z kolei, w czasie 
odczytu, powoduje zaindukowanie się siły elektromotorycznej w uzwojeniu głowicy. Przy- 
pisując stałej logicznej „1 jeden kierunek prądu, a stałej „0 drugi, otrzymuje się ciąg 
przemagnesowań dla różnych wartości bitów, w odpowiednich miejscach materiału magne- 
tycznego. Ponieważ nośnik obraca się pod głowicą przez cały czas pracy pamięci, to 
kolejne przemagnesowania układają się w tzw. ścieżkę (ang. track). Podczas odczytu, 
w zależności od kierunku przemagnesowania, indukują się siły elektromagnetyczne 
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Rysunek 5.20. Pamięć dyskowa: a) układ głowica-nośnik, b) Ścieżki z podziałem na sektory 
1 c) pamięć wielotalerzowa 
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o różnych kierunkach, co odpowiada odczytowi O lub 1. Jeżeli z powierzchnią magnetyczną 
współpracuje jedna głowica, to jest ona skokowo przesuwana wzdłuż promienia dysku i 
wówczas na jego powierzchni powstaje zbiór ścieżek (rys. 5.20b). Przesuwanie głowicy 
jest procesem wolnym (rzędu ms) i dlatego w niektórych pamięciach instalowano tyle 
głowic ile miało być ścieżek. Były to tzw. pamięci ze stałymi głowicami, których koszt 
był tak duży, że rozwiązanie to jest stosowane bardzo rzadko. W zależności od technologii 
liczba ścieżek na jednej powierzchni waha się od kilkudziesięciu do kilkuset. Ważnym 
parametrem pamięci dyskowych jest tzw. gęstość poprzeczna, czyli liczba Ścieżek na 
jednostkę długości. Wynosi ona od 2 do 10 ścieżek na milimetr. Podobnie określa się 
gęstość wzdłużną — jako liczbę zapisanych bitów na jednostkę długości wzdłuż śŚcież- 
ki. Uzyskiwano wzdłużne gęstości zapisu rzędu ok. 200 bitów na milimetr (kilku tysięcy 
na cal). 


Niech promień dysku twardego wynosi 100 mm i niech uda się wykorzystać 3/4 tej 
długości na zapis ścieżek. Jeśli gęstość ścieżek wynosi 10/mm, to ich liczba wynosi 750. 
Jeżeli gęstość zapisu wzdłuż ścieżki wynosi 200 b/mm, to dla średniej długości Ścieżki 
ok. 400 mm, jej pojemność wyniesie ok. 80 Kb. Pojemność takiego dysku wynosi zatem 
ok. 7,5 MB. 


Pamięci dyskowe są wykorzystywane jako pamięci masowe i ich najważniejszym 
parametrem jest pojemność. Celem zwiększenia pojemności stosuje się często pamięci 
z wieloma talerzami. Liczba talerzy może dochodzić do kilkudziesięciu, co pozwala na 
uzyskiwanie dużych pojemności, dochodzących do wielu gigabitów. Pamięci takie budo- 
wane są zwykle jako pamięci z ruchomymi głowicami w taki sposób, że z każdą powierz- 
chnią współpracuje jedna głowica i są one wspólnie przesuwane (rys. 5.20c). Ramię 
z głowicami jest sterowane wspólnie i ustawiane nad określonymi ścieżkami tworzącymi 
tzw. cylinder. 


W pamięciach dyskowych każdą ścieżkę dzieli się na kilkanaście lub kilkadziesiąt 
części zwanych sektorami. Mogą być to równe części (ang. hard sector) zaznaczone 
trwale na nośniku tzw. otworami indeksowymi lub nierówne części zaznaczane poprzez 
odpowiedni zapis magnetyczny (ang. sofł sector). Na rysunku 5.20b pokazano jak można 
podzielić ścieżkę na 8 sektorów stałej wielkości. Przyjmując parametry z podanego już 
przykładu otrzymamy, że każdy sektor ma pojemność 10 Kb. Na jednym talerzu można 
uzyskać 1500 ścieżek (talerz dwustronny) po 8 sektorów każda, co daje 12000 sektorów. 
Zatem potrzeba 14 bitów dla zaadresowania wszystkich sektorów. Jeżeli przykładowa 
pamięć ma 8 talerzy o 16 powierzchniach, to adres składa się z 3 części: 

— numeru powierzchni (numer głowicy) — 4 bity, 

— numeru cylindra (numer ścieżki) — 11 bitów, 

— numeru sektora — 3 bity. 


Całkowita pojemność takiej pamięci wynosi ok. 120 MB. 


Na rysunku 5.21 pokazano przykładowy format sektora dysku. Każdy sektor składa 
się z dwóch części: pola nagłówka (ang. identificator field) i pola danych. Pomiędzy tymi 
częściami i pomiędzy sektorami są przerwy międzyblokowe (ang. gap). Przerwy między 
nagłówkiem i polem danych zajmują 41 bitów, a przerwy między sektorami 37 (17 przed 
sektorem 1 20 za sektorem). Pole nagłówka składa się z bajtu synchronizacji (por. rozdz. 6), 
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Rysunek 5.21. Format scktora 


bajtu numeru powierzchni (głowicy), 2 bajtów numeru cylindra (Ścieżki), bajtu numeru 
sektora i 2 bajtów słowa CRC. Pole danych zaczyna się bajtem synchronizacji, za którym 
zapisywane są 512 bajty danych i 2 bajty CRC. 


Zestrajanie geometrii układu głowica-nośnik jest trudnym zadaniem. Najistotniejszym 
problemem jest powtarzalność ustawienia głowicy nad ścieżkami nawet przy wymianie 
nośnika. Jednym z rozwiązań tego zagadnienia są dyski typu Winchester. Są to dyski 
z twardym podłożem, w którym nośnika nie oddziela się od układu przesuwania głowic, 
aw razie potrzeby wymienia się cały napęd. Takie rozwiązanie ma na celu zestrojenie 
mechanizmu przesuwania głowic z danym dyskiem. 


Szybkość pracy pamięci dyskowych zależy od obrotów silnika. Niech dysk 
będzie sterowany silnikiem synchronicznym, to jest obracającym się z prędkością 
3000 obr/min (50 Hz). Jeden obrót trwa zatem 20 ms, a średni czas dostępu jest równy 
połowie czasu jednego obrotu, tj. 10 ms. Jeżeli na ścieżce jest 40 Kb, to szybkość transmisji 
wynosi 2 Mb/s, co pozwala na transmisję jednego sektora (512 bajtów) w czasie ok. 2 ms. 


Strob odczytu RD 


Strob zapisu WR — Jaag ' Ścieżka 
Sterowania zerowa 
Przesuń 
Numer Układ 
Powierzchni Wybierania 
Wejście Wyjście 
Wzmacniacz Wzmacniacz 
zapisu odczytu 


RO aaa 
wejścia 


Zegar 


Numer 


S 
cylindra top 


Uktad 
detekcji 
indeksu 


Numer 


sektora Sektor 


Rysunek 5.22. Układ sterujący pamięcią dyskową 
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Na rysunku 5.22 pokazano organizację przykładowej pamięci dyskowej z przesuwa- 
nymi głowicami. Sygnały do współpracy z magistralą adresową są podzielone na trzy 
grupy: bity adresu powierzchni, bity adresu cylindra (ścieżki) i bity adresu sektora. 
Współpraca z komputerem odbywa się w dwóch fazach. Pierwsza faza następuje po 
przesłaniu z komputera adresu cylindra. Wówczas kilka milisekund trwa pozycjonowanie 
głowic, aż do momentu pojawienia się sygnału STOP. W drugiej fazie podawana jest 
pozostała część adresu, która powoduje wybranie odpowiedniej głowicy (adres po- 
wierzchni) i odpowiedniego momentu czasu, tj. momentu pojawienia się impulsu indeksu 
(adres sektora), co jest sygnalizowane pojawieniem się sygnału SEKTOR. Moment ten 
rozpoczyna odczyt lub zapis sektora. Informacja na wejściu i wyjściu pamięci powinna 
być w postaci równoległej (bajty) i dlatego wzmacniacze zapisu i odczytu współpracują 
z układami przesuwania. Taktowanie rejestrów przesuwających odbywa się zgodnie 
z przebiegiem zegarowym, który powstaje na wyjściu specjalnego wzmacniacza odczytu- 
jącego, tzw. ścieżkę zegarową. Ścieżka ta jest nagrana zgodnie z przyjętą dla danego 
dysku częstotliwością odpowiadającą gęstości zapisu. 


Sterowanie odczytem i zapisem pamięci dyskowej odbywa się poprzez wejścia steru- 
jące RD (odczytu) i WR (zapisu). Celem zabezpieczenia powierzchni przed zniszczeniem 
przez głowicę (głowice unoszone są aerodynamicznie nad powierzchnią i podczas wy- 
łączenia napięcia zasilania mogą spaść na nośnik) w momencie zaniku napięcia zasilania 
sprowadza się głowice nad ścieżkę zerową (wejście sterujące Przesuń). Po prawidłowym 
przesunięciu pamięć sygnalizuje ten fakt sygnałem Ścieżka zerowa. W niektórych rozwią- 
zaniach pamięci dyskowych dodawane są inne funkcje jak: 

— kasowanie informacji, 

— zezwolenie na zapis, 

— zapis z ochroną (uniemożliwienie powtórnego zapisu), 

— wykrywanie zaniku napięcia zasilania, 

— korekcja błędów (słowo CRC), 

— różne szybkości przesuwu głowicy. 


5.4. PAMIĘĆ TAŚMOWA 


W pamięciach taśmowych informacja jest zapisywana na nośniku magnetycznym poło- 
żonym na elastycznym poliestrowym podkładzie. Klasyczna taśma magnetyczna ma szero- 
kość %" i długość 2400 stóp (szerokość ok. 12,7 mm i długość ok. 750 m). Jest ona 
nawijana na standardowe krążki o średnicy 10,5" (ok. 266,5 mm). Szybkość przewijania 
taśmy osiąga nawet 6 m/s, co wymaga specjalnego prowadzenia i naciągu taśmy oraz 
specjalnego napędu. Zapisu na taśmę dokonuje się w 9 rządkach (rys. 5.23) z gęstością 
standardową np. 640 b/mm. Przy szybkości przewijania 6 m/s daje to szybkość transmisji 
384 KB/s. Początek taśmy jest oznaczony znacznikiem BOT (ang. begining of the tape), 
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Rysunek 5.23. Rozmicszczenie informacji na taśmic magnetycznej 
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a koniec znacznikiem EOT (ang. end of tape). Za znacznikiem BOT znajduje się nagłó- 
wek — preambuła — (ang. preamble), który składa się z jedynki i czterdziestu zer. Na 
końcu taśmy, przed znacznikiem EOT, są bity posłowia (ang. postamble), które składają 
się z czterdziestu zer i jedynki. 


W pamięciach taśmowych informację pisze się i czyta blokami, tzw. rekordami, które 
są zapisywane w kolejności przychodzenia do zapisu. Dlatego nie stosuje się adresowania 
miejsca na taśmie, a dostęp do danego rekordu odbywa się przez podanie jego numeru 
licząc od początku taśmy. Kolejne rekordy są oddzielone przerwami międzyblokowymi 
o długości ok. 20mm. Pojemność taśmy zależy od liczby rekordów. Załóżmy długość 
rekordu 4 KB, czyli 51,2 mm przy gęstości zapisu 640 b/mm. Każdy rekord, wraz z przer- 
wą międzyblokową, zajmuje 71,2 mm, czyli na długości 750 m może ich być ok. 10000. 
Stąd pojemność takiej taśmy wynosi 40 MB. 


Pamięci z dostępem sekwencyjnym są budowane także jako pamięci taśmowe wy- 
korzystujące kasety taśmowe (ang. cartridge). Jest kilka standardów takich kaset. Jednym 
z nich jest standard stosowany w magnetowidach (ang. VCR — video casette recorder). 
Częściej jednak firmy produkujące takie urządzenia stosują swój standard. Przykładowa 
pamięć taśmowa PHD668 WangDAT model 1300 ma pojemność 1,3 GB na kasecie typu 
DAT, która mieści się w typowym napędzie o wielkości 5% cala. Kaseta zawiera taśmę 
o szerokości ok. 4 mm, którą napęd przesuwa z szybkością 8,15 mm/s. Gęstość zapisu 
wynosi ok. 2400 b/mm, a szybkość transmisji 183 KB/s (w trybie blokowym 4 MB/s). 


URZĄDZENIA ZEWNĘTRZNE 


6.1. WPROWADZENIE 


Podstawowym zadaniem urządzeń wejścia-wyjścia jest umożliwienie użytkownikowi 
komputera wprowadzanie programów i danych oraz wyprowadzanie wyników programów. 
Program i dane są czytelne dla komputera jedynie w postaci binarnej. Natomiast dla 
użytkownika czytelną postacią programu, danych i wyników są teksty albo obrazy. Po- 
wszechnie stosowane urządzenia we-wy można podzielić na dwie grupy: urządzenia pra- 
cujące w trybie znakowym i urządzenia pracujące w trybie graficznym. Urządzenia we-wy 
są łączone z komputerem poprzez sterownik, którego zadaniem jest zamiana postaci 
informacji z czytelnej przez użytkownika na czytelną przez komputer lub odwrotnie. 
Najpopularniejszym urządzeniem wejściowym znakowym jest klawiatura, natomiast 
urządzeniami wyjściowymi są monitor ekranowy i drukarka. Zwykle użytkownik komuni- 
kuje się z komputerem poprzez terminal czyli klawiaturę z monitorem. Natomiast drukarka 
jest używana wówczas, gdy operatorowi jest potrzebny dokument. Wymienione urządzenia 
należą do grupy operatorskich urządzeń zewnętrznych (ang. human-readable). Do tej 
samej grupy zaliczyć można także takie urządzenia wejściowe jak mysz lub pióro świetlne, 
wskazujące wybrane przez operatora miejsce na ekranie, lub tzw. digitizer zamieniający 
narysowane punkty na powierzchni na cyfrowe wartości ich współrzędnych. Graficznymi 
urządzeniami wyjściowymi są monitory ekranowe i plotery. Jeszcze innymi urządzeniami 
są akustyczne urządzenia we-wy wykorzystujące analizatory i syntetyzatory głosu. 


Drugą grupę urządzeń we-wy stanowią urządzenia wprowadzające 1 wyprowadzające 
informację, której postać jest nieczytelna dla operatora. Informacja jest zakodowana dwój- 
kowo, zapisana na specjalnym nośniku i czytelna jedynie przez specjalne urządzenia. 
Mówimy, że są to urządzenia maszynowe (ang. machine-readable). Przykładem takich 
urządzeń są pamięci z nośnikiem na dyskach elastycznych. Trzecią grupę stanowią urzą- 
dzenia łączące komputer ze źródłami lub z odbiornikami informacji, tj. urządzenia komuni- 
kacyjne lub urządzenia sterujące i pomiarowe połączone z komputerem przez konwertery 
analogowo-cyfrowe (A/D) lub cyfrowo-analogowe (D/A). 


Urządzenia zewnętrzne są dołączane do magistrali systemowej za pośrednictwem 
odpowiednich sterowników (ang. controller). Zadaniem ich jest dopasowanie tzw. łącza 
(ang. interface), tj. zbioru sygnałów urządzenia zewnętrznego do magistrali systemowej 
danego komputera. Sterownik przyjmuje polecenia obsługi zgłaszane zarówno przez 
urządzenie (np. drukarkę, która zgłasza brak papieru), jak i przez procesor, który wykonując 
rozkaz wejścia-wyjścia żąda dostępu. W obu przypadkach obsługa polega na wykonaniu 
przez procesor specjalnego programu. Żądanie dostępu do sterownika procesor zgłasza 
wysyłając adres przypisany temu sterownikowi na magistralę adresową. Dane i rozkazy są 
przesyłane przez magistralę danych. Sterownik odbiera także sygnały strobów odczytu 
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i zapisu z magistrali sterującej. Współpraca sterowników z procesorem odbywa się w trzech 
krokach. W pierwszym kroku procesor, wykonując rozkaz dotyczący urządzeń zewnętrz- 
nych, wysyła na magistralę adresową odpowiedni adres. W drugim kroku sterowniki 
dekodują wysłany adres i ten który rozpozna swój adres przechodzi w stan aktywny. 
Rozkaz może dotyczyć przesłania informacji do lub z urządzenia (rozkazy IN lub OUT 
procesora), a może też przygotowywać urządzenie do współpracy (rozkazy TEST lub 
START). W tym drugim przypadku procesor przesyła odpowiednie parametry, jak np. ilość 
transmitowanej informacji, sposób jej przesyłania. Niekiedy procesor żąda od sterownika 
informacji na temat stanu urządzenia (a także stanu samego sterownika), jak np. jego 
zajętości. Trzecim krokiem jest dokonanie samego przesłania. 


Transmisje mogą być dwóch rodzajów: 
—  znakowe, jeśli przesyłany jest jeden bajt, 
— blokowe, gdy przesyłany jest ciąg bajtów. 


Urządzenia realizujące transmisje pierwszego rodzaju nazywane są urządzeniami znako- 
wymi. Są to urządzenia wolne, których czas działania znacznie przewyższa czas wy- 
konania rozkazu przez procesor. Na przykład klawiatura jest urządzeniem, którego 
szybkość nie przekracza 10 znaków na sekundę. Popularne drukarki drukują ok. 100 
znaków na sekundę, co odpowiada czasowi transmisji ok. 10 ms na znak. Czas ten także 
jest znacznie dłuższy niż czas wykonania jednego rozkazu. Przykładowo wydrukowanie 
na drukarce jednego znaku zajmuje czas wykonania ok. 10 000 rozkazów. Taka różnica 
szybkości stwarza pewne problemy przy współpracy tych układów. Dla synchronizacji 
pracy procesora wykonującego program z wolnym urządzeniem zewnętrznym stosuje się 
2 podstawowe sposoby. Pierwszy to programowa obsługa urządzeń zewnętrznych, 
a drugi to współpraca polegająca na przerwaniu (ang. interrupt) pracy procesora (przer- 
wany zostaje wykonywany program) przez wolne urządzenie. W następnym podrozdziale 
omówiono oba te sposoby. 


Urządzenia realizujące transmisje blokowe są zwykle urządzeniami szybszymi niż 
urządzenia znakowe. Transmisje blokowe zachodzą pomiędzy pamięcią i urządzeniami 
1 mogą być realizowane na dwa sposoby: 

l) pod nadzorem procesora, który wykonuje program kolejnego odczytywania ko- 

mórek pamięci i przesyłania ich zawartości do urządzenia, 

2) pod nadzorem innego układu, który generuje adresy i stroby dla pamięci i urządzeń 

zewnętrznych. 


Pierwszy sposób to po prostu wielokrotnie powtarzana transmisja znakowa. Transmisja 
zachodzi z szybkością wykonywania programu przez procesor. Załóżmy, że szybkość 
transmisji z pamięci dyskowej wynosi 4 MB/s, a czas cyklu pamięci operacyjnej 250 ns. 
Szybkości pracy obu tych urządzeń są równe i dlatego czas transmisji jednego bajtu może 
wynosić 250 ns. Ponieważ czas wykonania rozkazu procesora jest zawsze dłuższy od 
czasu dostępu do pamięci (np. 1 Us), to transmisja pod nadzorem procesora jest zawsze 
wolniejsza (np. 4-krotnie). 


Drugi sposób stosuje się wtedy, gdy wymagana szybkość transmisji jest duża. Sposób 
ten polega na tym, że po zainicjowaniu transmisji, procesor odłącza się od magistrali, 
zwalniając ją dla specjalnego układu generacji adresów i strobów, aby zapewnić możliwość 
przesłań bezpośrednio pomiędzy urządzeniem i pamięcią. Taki sposób transmisji nazywa 
się transmisją bezpośredniego dostępu do pamięci — DMA (ang. direct memory access). 
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6.2. SYTUACJE WYJĄTKOWE 


Istnieją zdarzenia, które powstają w systemie komputerowym w czasie wykonywania 
programu przez procesor i które wymagają jego reakcji czyli programowej obsługi tego 
zdarzenia. Aby spełnić to wymaganie procesor musi przerwać wykonywanie właściwego 
programu i przejść do stanu, w którym wykona odpowiedni program wcześniej 
umieszczony w pamięci komputera. Ponieważ zdarzeń takich może być wiele, to i zapa- 
miętanych programów także musi być wiele. Zdarzenia wywołujące przerwanie wykony- 
wania właściwego programu przez procesor i wywołanie odpowiedniego programu reakcji 
na to zdarzenie nazywane są sytuacjami wyjątkowymi (ang. exception). Sytuacje wyjąt- 
kowe mogą być dwojakiego rodzaju: 

l) sytuacje wyjątkowe powstałe w wyniku działania programu wykonywanego przez 

procesor, 
2) sytuacje wyjątkowe pochodzące z układów współpracujących z procesorem. 


Do pierwszej grupy sytuacji wyjątkowych należą zdarzenia niezamierzone, jak na przykład 
błędy, i zdarzenia zamierzone w programie, jak na przykład napotkanie umieszczonych 
w nim specjalnych rozkazów. Błędy mogą być następujące: 
— błąd adresowania, czyli wygenerowanie przez procesor adresu niedozwolonego 
(adres nie istniejący lub adres zabroniony), 
— błąd rozkazowy, czyli użycie nielegalnej instrukcji w programie, 
— błąd argumentu, czyli próba wykonania operacji niemożliwej (dzielenie przez 
zero). 


Zdarzenia zamierzone to zwykle zdarzenia, które są pomocne podczas uruchamiania 
programów. Wyróżnić można trzy rodzaje takich zdarzeń: 

l) Praca krokowa (ang. single step), czyli wykonywanie programu instrukcja po 
instrukcji. Umieszczone w programie rozkazy HALT (STOP) zatrzymują jego 
pracę aż do momentu reakcji operatora, tj. zmiany specjalnego sygnału wejścio- 
wego. 

2) Praca w trybie śledzenia (ang. tracing), czyli wykonywanie po zadanym typie 
rozkazu (lub każdym rozkazie) specjalnego podprogramu umożliwiającego moni- 
torowanie działania tych rozkazów. 

3) Praca w trybie pułapki (ang. breakpoint), czyli wykonywanie programu aż do 
miejsca, w którym programista podmienił rozkaz danego programu rozkazem 
wymuszającym specjalną reakcję. Przykładowo może to być zatrzymanie pracy 
procesora, kontrola stanów jego rejestrów i podmiana rozkazu-pułapki na rozkaz 
właściwy celem dokończenia wykonywania programu. 


Do drugiej grupy sytuacji wyjątkowych należą zdarzenia, które także można podzielić na 
dwie klasy: 
— błędy wykryte w różnych miejscach komputera przez specjalne układy detekcji 
błędów, 
— zdarzenia służące synchronizacji pracy procesora z urządzeniami znacznie wolniej- 
szymi od niego, informującymi go o swojej gotowości do pracy. 
Błędy mogą pochodzić z różnych źródeł, jak np.: 
— błąd na magistrali, gdzie specjalne układy mogą wykryć żądanie dostępu do nie 
istniejącego lub zabronionego obszaru pamięci, 
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— błąd transmisji, gdzie wykryto różnicę danych wysłanych i odebranych, 
— błąd zasilania, gdzie układ elektroniczny stwierdził brak napięcia zasilającego lub 
niewłaściwe warunki zasilania. 


Synchronizacja pracy procesora z wolnymi urządzeniami zewnętrznymi ma na celu dopusz- 
czenie możliwości współbieżnej pracy procesora i urządzeń zewnętrznych. Przykładowo 
drukowanie na wolnej drukarce wyników pomiarów temperatury w reaktorze atomowym 
nie może przerywać na długi czas procesu samego pomiaru. Dlatego po każdym zakoń- 
czeniu drukowania jednego wyniku drukarka zgłasza swoją gotowość do przyjęcia następ- 
nej informacji i wtedy procesor przerywa wykonywanie właściwego programu (pomiar 
temperatury) tylko na czas jej przesłania, a w czasie jej drukowania wykonuje dalej swój 
program. Przykład dotyczył specjalnego rodzaju pracy systemów komputerowych, tzw. 
systemów czasu rzeczywistego (ang. real-time system). Przykład ten nie oddaje w pełni 
zasadności synchronizacji. Ujawnia się ona dopiero w tzw. systemach wieloprogramo- 
wych, gdzie jednocześnie wykonuje się wiele programów i mogą one wszystkie żądać 
dostępu do urządzeń zewnętrznych. Dostępem tym steruje program stale rezydujący w pa- 
mięci komputera, tzw. system operacyjny. Będzie o nim mowa w następnym rozdziale, 
a tu zatrzymamy się bliżej na sposobach organizacji współpracy procesora z urządzeniami 
zewnętrznymi, a w szczególności na systemie przerwań. 


6.3. SYSTEMY PRZERWAŃ 


6.3.1. ZASADY OBSŁUGI PRZERWAŃ 


W komputerach pracuje zwykle wiele urządzeń zewnętrznych i każde z nich ma własny 
sterownik, którego jednym z zadań jest zgłaszanie procesorowi żądań przerwań. Procesor 
może wykrywać te zdarzenia na dwa sposoby: 

1) przez okresowe sprawdzanie stanów sterowników, 

2) przez odebranie sygnałów informujących o zdarzeniu. 


Pierwszy sposób jest nazywany programowym sposobem obsługi urządzeń wejścia-wyjścia 
i omówiono go w podrozdzale 6.3.2. Polega on na tym, że system operacyjny 
(por. rozdz. 7) co pewien czas, ustalony przez projektantów komputera, przerywa wykony- 
wanie programu i przechodzi do wykonywania programu sprawdzającego stany źródeł. 
Drugi sposób jest nazywany sprzętowym sposobem obsługi przerwań, gdyż procesor 
odbiera sygnał o powstałym zdarzeniu. Wadą pierwszego sposobu jest wydłużenie czasu 
pracy wykonywania programu, a wadą drugiego sposobu jest to, że komputer należy 
wyposażyć w odpowiednie układy realizujące ten proces. Sposób pierwszy jest stosowany 
w tanich i prostych komputerach, a sposób drugi w systemach złożonych i droższych. 


Są dwa najważniejsze zadania systemu przerwań: 

— rozpoznanie źródła przerwania, 

— zapewnienie odpowiedniej kolejności obsługi wielu urządzeń, które mogą jedno- 
cześnie żądać takiej obsługi. 


Sposoby realizacji tych zadań będą omówione kolejno: najpierw dla programowego syste- 
mu przerwań, a następnie dla sprzętowego. 
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6.3.2. PROGRAMOWA OBSŁUGA URZĄDZEŃ ZEWNĘTRZNYCH 


Programowa obsługa urządzeń polega na tym, że oprogramowanie systemowe (system 
operacyjny) co pewien czas powoduje przerwanie wykonywania właściwego programu 
(programu użytkowego) i dokonuje sprawdzenia stanu wszystkich sterowników urządzeń. 
Problem rozpoznania źródła przerwania tu nie występuje, gdyż wysyłając adres urządzenia 
do sterownika procesor wie jakie urządzenie teraz sprawdza. Problem zapewnienia od- 
powiedniej kolejności obsługi różnych urządzeń żądających przerwania jest rozwiązany 
w taki sposób, że kolejność ta jest zgodna z kolejnością przeglądania. Załóżmy, że kom- 
puter pracuje w konfiguracji z klawiaturą, monitorem i drukarką. W czasie pracy kompu- 
tera każde z tych urządzeń inaczej współpracuje z procesorem. Drukarka pracuje tylko na 
żądanie procesora, gdyż inicjalizacja jej pracy następuje przez wykonanie rozkazu OUT 
w programie. Klawiatura jest urządzeniem operatorskim i służy do wprowadzania rozka- 
zów i danych. Nawet gdy nie jest wykonywany żaden program, to procesor oczekuje na 
znak od niej. Monitor wyświetla obraz w standardzie telewizyjnym, co powoduje, że obraz 
musi być regenerowany co pewien czas. Załóżmy, że monitor żąda regeneracji dokładnie 
co 10 ms (tyle trwa jeden obraz) i wówczas co ten czas procesor musi wykonać program 
obsługi monitora polegający na przesłaniu do monitora (a raczej jego pamięci buforowej) 
zawartości nowego obrazu. 


Rozpatrzmy jak przebiega współpraca procesora z trzema omówionymi urządzeniami. 
Klawiatura jest gotowa do obsługi nie częściej niż co 100 ms (10 zn/s), natomiast drukarka 
czeka na wykonanie przez procesor rozkazu OUT. Co 10 ms przerywana jest praca 
procesora i wykonywany jest program obsługi monitora. Ponieważ proces ten zachodzi 
periodycznie, to można tak zorganizować pracę systemu, aby po każdej obsłudze monitora 
procesor sprawdzał stan klawiatury. Jeśli nie żąda ona obsługi (klawisz nie został na- 
ciśnięty), to procesor powraca do wykonywania właściwego programu. Jeżeli natomiast 
klawiatura żąda obsługi, to procesor przejdzie do wykonania podprogramu wczytania 
znaku z klawiatury i dopiero potem powróci do programu właściwego. Jeśli procesor 
aktualnie nie wykonuje programu użytkowego, to mimo tego musi być gotowy do odebra- 
nia znaku z klawiatury. Realizuje to zadanie ciąg rozkazów stanowiący pętlę oczekiwania 
na znak z klawiatury. Jest to pętla, w której procesor odczytuje stan sterownika klawiatury, 
aż napotka zgłoszenie żądania obsługi. Jeżeli żądanie to nie nastąpi w ciągu 10 ms, to 
procesor ponownie przejdzie do obsługi monitora. Jeżeli równocześnie pojawią się oba 
żądania, to procesor wykona te, które już wcześniej w czasie projektowania systemu, 
otrzymało pierwszeństwo. Problem pierwszeństwa jest nazywany przyznawaniem 
priorytetów (ang. priority). Priorytetowy system przerwań określa kolejność obsługi wielu 
zgłoszeń przerwań. W naszym przykładzie pierwszeństwo musi otrzymać monitor i mówi- 
my, że ma on wyższy priorytet niż klawiatura. 


Niech w systemie komputerowym, w którym procesor wykonuje jeden rozkaz w czasie 
l us, pracuje operator piszący na klawiaturze z szybkością 10 zn/s, tj. z szybkością 
100 ms/znak. Niech wykonywany program składa się z 100 000 rozkazów. Jeżeli program 
nie odwołuje się do urządzeń zewnętrznych, to czas jego wykonania będzie wynosił 
100 ms. Jeśli jednak założyć, że w programie co 1000 rozkazów pojawia się rozkaz 
odwołania do urządzenia zewnętrznego (wobec tego jest 100 takich rozkazów) np. do 
drukarki, której obsługa trwa 10 ms, to całkowity czas wykonania programu wyniesie 


100 ms + 100-10 ms = 1100 ms 
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a więc Il razy dłużej. Jeżeli założyć, że procesor sprawdza stan sterownika klawiatury co 
5ms i że proces ten trwa 0,1 ms, to czas wykonania programu wydłuży się jeszcze 
o czas t, gdzie 


t=(1100 : 5):0,1 ms = 220:0,1 ms = 22 ms 


Umiknięcie tak dużego zwiększenia czasu wykonywania programu jest możliwe przy 
zastosowaniu sprzętowego systemu przerwań, gdzie urządzenie sygnalizuje procesorowi 
swą gotowość. Tę zaletę okupuje się rozbudową układu, co zwiększa koszt systemu. 


Jak już wcześniej powiedziano, obsługa przerwania polega na wywołaniu odpowied- 
niego podprogramu. Ale moment wywołania go nie może być przypadkowy. Procesor 
reaguje na sygnał żądania przerwania tylko na końcu cyklu instrukcyjnego. Chodzi o to, 
aby mógł być zapamiętany stan procesora przed rozpoczęciem wykonywania podprogramu 
i aby po jego zakończeniu procesor mógł powrócić do tego samego miejsca i w takim 
samym stanie. Dlatego po odebraniu sygnału przerwania procesor wykonuje program 
zapamiętania swojego stanu, tj. adresu ostatnio wykonywanej instrukcji oraz zawartości 
swoich rejestrów. Wówczas po zakończeniu wykonywania podprogramu obsługi danego 
przerwania procesor, po odczytaniu zapamiętanego stanu, będzie mógł powrócić do stanu, 
w którym był przed przyjęciem przerwania. Zapamiętanie stanu procesora zwykle polega 
na przesłaniu adresu ostatniej instrukcji i zawartości rejestrów na stos (por. rozdz. 4). 
Ułatwia to realizację tzw. wielopoziomowych systemów przerwań, gdzie dopuszcza się 
możliwość przerwania wykonywania podprogramu obsługi jakiegoś przerwania przez 
przerwanie o wyższym priorytecie. Każde przerwanie powoduje odłożenie na stosie stanu 
procesora, a każdy powrót z podprogramu obsługi powoduje zdjęcie ze stosu stanu pro- 
cesora. 


6.3.3. SPRZĘTOWY SYSTEM PRZERWAŃ 


Periodycznego sprawdzania stanu urządzeń można uniknąć wtedy, gdy każdy sterownik 
wyposażono w możliwość zgłaszania sygnału przerwania do specjalnego układu, tzw. ukła- 
du przerwań. Sygnał będzie odbierany przez ten układ, który z kolei będzie powiadamiał 
procesor o fakcie zgłoszenia przerwania. Dwie podstawowe funkcje systemu przerwań, 
tj. rozróżnienie źródła przerwania i ustalenie kolejności obsługi mogą być wykonywane 
bądź programowo, bądź sprzętowo. W pierwszym przypadku zadaniem układu przerwań 
jest wyłącznie powiadomienie procesora o fakcie zaistnienia przerwania. Po odebraniu 
takiego sygnału procesor przerywa wykonywanie programu głównego i inicjuje wykonanie 
programu przeglądania stanów urządzeń. Zysk czasowy, w stosunku do poprzedniego 
rozwiązania, polega na tym, że procesor odczytuje stany urządzeń nie co zadany czas, ale 
w momencie zgłoszenia przerwania. Ten sposób pracy jest nazywany przerwaniem z prze- 
glądaniem (ang. poll and interrupt). Układ przerwań jest w tym przypadku bardzo prosty 
składa się bowiem z jednej bramki sumy, na której wejścia podawane są sygnały żądań 
przerwania z poszczególnych sterowników. W drugim przypadku, tj. sprzętowego roz- 
poznawania przerwań i ustalania kolejności obsługi, układ jest bardziej złożony. Jego 
zadania to: 

— rozróżnienie źródła przerwania polegające na przesłaniu procesorowi numeru 

(adresu) urządzenia żądającego przerwania, 
— wyznaczenie kolejności obsługi urządzeń. 
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Rozróżnienie źródła przerwania może być dokonane w układzie kodera, który na podstawie 
kodu „1 z n” (w przypadku zgłoszenia sygnału tylko od jednego sterownika) tworzy słowo 
w kodzie NKB. Słowo to odpowiada numerowi urządzenia i nazywane jest wektorem 
przerwań. Wektor ten jest wykorzystywany przy tworzeniu adresu początku podprogramu 
obsługi tego urządzenia. Wyznaczenie kolejności obsługi następuje w przypadku wielu 
zgłoszeń równoczesnych i polega na ustaleniu numeru urządzenia o najwyższym priory- 
tecie spośród żądających przerwania. Zadanie to wypełnia koder priorytetowy, który na 
podstawie słowa wejściowego wybiera wejście o najwyższym priorytecie (np. najbardziej 
znaczące) i na wyjściu generuje słowo w kodzie NKB odpowiadające temu wejściu. 
W obu opisanych wyżej przypadkach systemy przerwań mogą realizować pewne dodatko- 
we funkcje, jak np.: 

1) możliwość blokowania systemu przerwań przez procesor, 

2) dezaktywowanie wybranych sterowników przez procesor, 

3) możliwość przerywania programu obsługi dowolnego przerwania przez przerwanie 

o wyższym priorytecie. 


MOŻLIWOŚĆ BLOKOWANIA SYSTEMU PRZERWAŃ PRZEZ PROCESOR 


W wielu systemach procesor ma możliwość dokonania blokowania systemu przerwań 
przez wykonanie odpowiedniego rozkazu, który dezaktywuje wejście INT procesora. 
System przerwań jest wówczas wyłączony i żadne przerwanie nie może zostać obsłużone. 
Procesor dezaktywuje system przerwań w czasie, gdy wykonania jego programu nie 
można przerwać. Może to mieć miejsce wówczas, gdy procesor pracuje w czasie rzeczy- 
wistym, wykonuje programy testujące lub inne programy systemowe. 


DEZAKTYWOWANIE WYBRANYCH STEROWNIKÓW PRZEZ PROCESOR 


W celu dezaktywacji poszczególnych urządzeń procesor wysyła do systemu przerwań 
tzw. słowo maski. Każdej pozycji tego słowa odpowiada jeden sterownik. Jeśli na pozycji 
odpowiadającej danemu sterownikowi jest 1, to mimo zgłoszenia przerwania przez dane 
urządzenie, nie będzie ono zarejestrowane przez układ przerwań. 


MOŻLIWOŚĆ PRZERYWANIA PROGRAMU OBSŁUGI DOWOLNEGO PRZERWANIA 
PRZEZ PRZERWANIE O WYŻSZYM PRIORYTECIE 


Możliwość przerwania programu obsługi danego urządzenia przez przerwanie o wyższym 
priorytecie jest realizowane w tzw. wielopoziomowym układzie przerwań (ang. mulii- 
-level interrupt system). Przerywanie programu obsługi urządzenia o niższym priorytecie 
przez program obsługi urządzenia o wyższym priorytecie jest nazywany trybem pracy 
z zagnieżdżaniem przerwań (ang. nested mode). 


Można wyróżnić dwa typy sprzętowych systemów przerwań: łańcuchowy układ 
przerwań (ang. daisy-chain) i układ przerwań z koderem priorytetowym. Układy te są 
pokazane na rysunku 6.1. W układzie łańcuchowym z rysunku 6.la zadaniem układu 
zgłoszenia przerwań jest tylko rejestracja zgłoszeń przerwań, czyli odebranie sygnałów 
przerwań ze sterowników i przesłanie procesorowi sygnału INT. Sterownik o najniższym 
numerze, który zgłosił przerwanie, tj. sterownik urządzenia o najwyższym priorytecie 
wysyła swój numer na magistralę danych po potwierdzeniu przyjęcia przerwania przez 
procesor sygnałem INTA. Procesor odczytując ten numer może wywołać program obsługi 
tego urządzenia. 
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Rysunek 6.1. Układy przerwań a) typu łańcuchowego i b) z koderem priorytetowym 


W układzie łańcuchowym rozstrzyganie o kolejności obsługi następuje poprzez umiej- 
scowienie danego sterownika w łańcuchu. Im wyższy priorytet nadawany jest urządzeniu, 
tym bliżej układu zgłoszenia przerwań umieszcza się go w łańcuchu. Każdy sterownik 
zgłasza żądanie przerwania do układu zgłoszenia przerwania. Pojawienie się już jednego 
z nich powoduje przesłanie sygnału INT do procesora i uaktywnienie łańcucha. Układ 
przerwań może być albo w stanie oczekiwania na przerwanie, albo w stanie obsługi 
przerwania. W stanie oczekiwania układ zgłoszenia przerwań wysyła 1 na wejście El 
pierwszego układu, umożliwiając w ten sposób zgłoszenie przez niego przerwania. Każdy 
sterownik działa w taki sposób, że jeżeli na jego wejściu EI jest 0 (blokada zgłoszenia 
przerwania), to i na wyjściu EO jest 0. Jeżeli natomiast na jego wejściu EI jest 1, to stan 
jego wyjścia EO zależy od tego, czy zgłasza on przerwania czy nie. Jeżeli zgłasza 
przerwania, to ustawia na swoim wyjściu 0 blokując dalszy ciąg łańcucha, a jeżeli nie 
zgłasza przerwania, to na wyjściu ustawia 1 odblokowując dalszy ciąg łańcucha. Sterownik 
zgłaszający przerwanie musi jednocześnie wysłać swój numer (wektor przerwań) na 
magistralę danych systemu, aby procesor mógł rozpoznać urządzenie przerywające jego 
pracę. 


Na rysunku 6.2 pokazano strukturę łańcuchowego układu przerwań. Jak widać układ 
zgłoszenia przerwań jest bardzo prosty, gdyż składa się z jednej bramki sumy. Początkowo 
układ zgłoszenia przerwań odblokowuje cały łańcuch wysyłając 1 na swoje wyjście. Jeżeli 
urządzenie we-wy poprzez swój sterownik żąda przerwania, to wysyła sygnał do układu 
zgłoszenia przerwań i rozpocznie tym samym akcję zgłoszenia przerwania do procesora. 
Na wyjściu układu zgłoszenia przerwań pojawi się sygnał INT, który przesłano do pro- 
cesora. Jednocześnie na wyjściu EO danego sterownika pojawi się 0, które zablokuje 
dalsze stopnie łańcucha. Gdy procesor potwierdzi odebranie zgłoszenia przerwania syg- 
nałem INTA (ang. interrupt acknowledge), to nastąpi otwarcie bufora wyjściowego 
sterownika dołączającego go do magistrali. Podczas strobu odczytu, pojawiającego się na 
magistrali sterującej, sterownik wyśle swój numer na magistralę danych. Na tej podstawie 
procesor będzie mógł utworzyć adres początku podprogramu obsługi tego urządzenia. 
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Rejestr 


Rysunek 6.2. Łańcuchowy układ przerwań i pierwszy sterownik w łańcuchu 


W zależności od tego czy układ przerwań jest zaprojektowany jako jednopoziomowy 
czy jako wielopoziomowy, układ zgłoszenia przerwań blokuje lub nie cały łańcuch. Jeśli 
układ jest jednopoziomowy, to układ zgłoszenia przerwań wysyła 0 na wejście łańcucha 
itym samym nie dopuszcza do dalszych zgłoszeń. Jeśli układ jest wielopoziomowy, to 
układ zgłoszenia przerwań wysyła 1 i sterowniki umieszczone bliżej tego układu mogą 
zgłosić przerwanie w czasie obsługi już zgłoszonego przerwania. W takim przypadku, po 
potwierdzeniu przyjęcia przerwania przez procesor, przerwany zostanie podprogram 
obsługi pierwotnie zgłoszonego przerwania i zostaje wywołany podprogram obsługi 
przerwania o wyższym priorytecie. Po zakończeniu wykonywania tego podprogramu 
system powraca do dokończenia poprzednio rozpoczętego podprogramu obsługi urządzenia 
o niższym priorytecie. Jeśli układ przerwań jest wyposażony w system maskowania, to 
sterownik musi także odczytać bit maski M. 


Na rysunku 6.2 pokazano uproszczony sposób wykorzystania bitu M. Jeśli dane 
urządzenie ma zostać zamaskowane, to należy ustawić bit maski M na 0. Powoduje to 
blokadę sygnału IRQ (przerzutnik nie zostanie zapalony) oraz dezaktywację dalszych 
stopni łańcucha. W pokazanym układzie zamaskowanie danego sterownika powoduje 
zablokowanie przyjmowania zgłoszeń przerwań od urządzeń o niższych priorytetach. 


Na rysunku 6.3 pokazano układ przerwań z koderem priorytetowym. Układ ten 
(rys. 6.1b) rejestruje fakt zgłoszenia przerwania, a następnie sam znajduje, koduje i wysyła 
na magistralę numer urządzenia o najwyższym priorytecie. Sygnały żądań przerwań I. 
przychodzące ze sterowników są podawane na wejścia układu dekodera priorytetowego 


Rysunek 6.3. Układ przerwań z koderem priorytetów 


9 — Podstawy budowy i działania komputerów 
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DP, tj. układu wyszukiwania najbardziej znaczącej jedynki w słowie wejściowym. Załóżmy, 
że priorytety rosną wraz ze wzrostem indeksów wejść I. Oznacza to, że najwyższy 
priorytet ma urządzenie, które wysyła sygnał żądania przerwania I. Na wyjściu układu 
DP pojawia się słowo w kodzie „1 z 8”, przy czym 1 pojawia się na pozycji odpowiadającej 
zgłoszonemu przerwaniu o najwyższym priorytecie. Jeśli na wejściu I, jest I, to i na 
wyjściu najbardziej znaczącym jest 1. Jeśli zaś na wejściu I. jest 0, to na wyjściu naj- 
bardziej znaczącym jest 0, a wartości na dalszych pozycjach zależą od stanu na pozostałych 
wejściach. Wyjściowe słowo układu DP jest podawane na wejścia kodera, na którego 
wyjściach pojawia się słowo w kodzie NKB, określające numer urządzenia żądającego 
przerwania o najwyższym priorytecie. Jednocześnie pojawia się sygnał wyjściowy INT, 
który jest podawany na odpowiednie wejście procesora. Wielopoziomowy system przerwań 
jest realizowany w tym układzie przez procesor, który może wysłać sygnał INTA w róż- 
nych momentach. Jeżeli zostanie on wysłany po zakończeniu programu obsługi przerwania, 
to system pracuje jako jednopoziomowy, gdyż przerzutnika nie wyzerowano i tym samym 
nie pojawi się ponowny sygnał INT. Jeśli natomiast INTA wysłano natychmiast po 
odebraniu zgłoszenia przerwania, to system pracuje jako wielopoziomowy, gdyż sygnał 
INT może powstać w czasie obsługi przerwania o niższym priorytecie. 


Na rysunku 6.3. pokazano także układ maskowania. Słowo maskujące jest zapisywane 
do rejestru maski, którego zawartość steruje wejściami dekodera priorytetowego poprzez 
bramki iloczynów w taki sposób, że zamaskowanie danego wejścia polega na wpisaniu 0 
na daną pozycję rejestru maski. 


W obu omówionych przypadkach układ przerwań wysyła poprzez magistralę danych 
numer (adres) takiego urządzenia, które ma najwyższy priorytet spośród tych, które żądają 
przerwania. Procesor po odczycie tego numeru zamienia go na adres rozkazu skoku do 
podprogramu umieszczonego właśnie w tym miejscu pamięci. Pod tym adresem znajduje 
się początek programu obsługi tego przerwania. Każdemu urządzeniu pracującemu poprzez 
przerwania odpowiada jeden program obsługi umieszczony w odpowiednim miejscu w pa- 
mięci. Zamiana numeru urządzenia na odpowiedni adres może zostać dokonana przez 
specjalny program lub przez umieszczoną w pamięci tablicę. W niektórych systemach 
rozbudowuje się sterowniki urządzeń tak, aby one przesyłały do procesora już gotowy 
adres programu. W takim przypadku sterownik jest wyposażony w rejestr, który prze- 
chowuje ten adres. Często zdarza się, że w systemie musi istnieć możliwość zmiany 
konfiguracji, a więc i zmiany adresów początków programów. Wówczas należy zmienić 
zawartość rejestru przechowującego adres. Początkowa jego zawartość jest zapisywana 
w czasie inicjalizacji pracy, tj. np. po włączeniu napięć zasilania, a następnie procesor 
może zapisać do rejestru nową jego zawartość. Powoduje to, że sterownik musi być tak 
zaprojektowany, aby jego rejestry mogły być zarówno odczytywane jak i zapisywane 
przez procesor. 


6.4. STEROWNIKI URZĄDZEŃ ZEWNĘTRZNYCH 
6.4.1. RODZAJE STEROWNIKÓW 


Na rysunku 6.4 pokazano typową strukturę sterownika i zbiór jego sygnałów wejściowych 
1 wyjściowych. Sygnały znajdujące się z lewej jego strony stanowią łącze z magistralą 
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Rysunek 6.4. Struktura sterownika urządzenia zewnętrznego 


systemową komputera, a więc służą do współpracy z procesorem. Sterownik jest dołączony 
do magistrali adresowej (linie te są wejściami sterownika), do magistrali danych i do 4 
linii magistrali sterującej (stroby odczytu i zapisu oraz sygnały zgłoszenia przerwania 
ipotwierdzenia jego przyjęcia). Sygnały z prawej jego strony stanowią łącze z urzą- 
dzeniem zewnętrznym. Są to linie przesyłania danych i dwie linie sterujące tym prze- 
syłaniem. Ponieważ zwykle w systemie komputerowym pracuje wiele sterowników, to 
każdemu z nich przypisany jest adres. Jeżeli sterownik zawiera dużą liczbę rejestrów, 
to przypisuje się mu więcej niż jeden adres. W szczególności każdemu rejestrowi 
przypisuje się inny adres. Istnieją dwa sposoby umieszczania sterowników urządzeń 
w przestrzeni adresowej. Pierwszy sposób zakłada wspólną przestrzeń adresową z pa- 
mięcią, a drugi zakłada rozdzielenie tych obszarów. W pierwszym przypadku procesor, 
wysyłając adres, wysyła na magistralę sterującą te same sygnały strobów odczytu i zapisu 
jak dla pamięci. Dostęp do urządzeń zewnętrznych następuje tymi samymi rozkazami co 
dostęp do pamięci. W drugim przypadku procesor wraz z adresem wysyła sygnały 
strobujące przeznaczone wyłącznie do urządzeń zewnętrznych. Stroby te powstają tylko 
w czasie wykonywania rozkazów wejścia-wyjścia (IN i OUT) i tylko one zapewniają 
dostęp do urządzeń zewnętrznych. 


W łączu sterownika z urządzeniem zewnętrznym wyróżnić można linie danych i linie 
sterujące. Na rysunku 6.4 pokazano wiele linii danych (najczęściej jest ich 8) i wtedy 
mówi się, że transmisja informacji do/z urządzenia zewnętrznego zachodzi równolegle, 
a sterownik nazywamy sterownikiem łącza równoległego. Jeśli jest jedna linia danych, to 
mówi się, że transmisja zachodzi szeregowo, a sterownik nazywamy sterownikiem łącza 
szeregowego. Linie danych mogą być jednokierunkowe lub dwukierunkowe. W przypadku 
łącza jednokierunkowego urządzenie może być albo odbiornikiem (urządzenie wyjściowe) 
lub nadajnikiem (urządzenie wejściowe). W przypadku linii dwukierunkowych łącza mogą 
być dwojakiego rodzaju: łącze dupleksowe, gdy transmisja w obu kierunkach może 
zachodzić równocześnie, lub łącze półdupleksowe, gdy transmisja w obu kierunkach jest 
rozdzielona w czasie. W następnym podrozdziale przedstawiono typowe sterowniki łączy 
równoległego i szeregowego. Przy omawianiu tych ostatnich przedstawiono łącza duple- 
ksowe i półdupleksowe. Typowy sterownik jest wykorzystywany do współpracy z typowy- 
mi urządzeniami zewnętrznymi wyposażonymi w standardowe łącze. Zwykle są to proste 
urządzenia znakowe, jak np. drukarka. Natomiast są urządzenia, które wymagają specjalnej 
obsługi i muszą pracować z magistralą poprzez sterownik specjalnie dla nich zaprojek- 
towany. Przykładowym takim urządzeniem jest pamięć dyskowa. W niniejszej książce nie 
będą omawiane sterowniki specjalizowane, natomiast przedstawiono budowę typowych 
sterowników. 
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6.4.2. STEROWNIK STANDARDOWEGO ŁĄCZA RÓWNOLEGŁEGO 


Łącze równoległe jest wykorzystywane dla transmisji na niewielkie odległości. Wynika to 
z faktu, że koszt połączeń nadajnika i odbiornika wieloma przewodami jest wysoki, co 
stanowi zasadniczą wadę tego rozwiązania. Zaletą stosowania tego łącza jest jego duża 
szybkość transmisji. Najczęściej projektowane są łącza zawierające 8 linii danych, czyli 
przeznaczone dla transmisji bajtowej. Transmisja pomiędzy urządzeniami nadawczym 
i odbiorczym jest synchronizowana i dlatego łącze zawiera dwie linie przeznaczone dla 
sygnałów sterujących: 

— linię strobu przesyłanej informacji STB, 

— linię sygnału zezwolenia na transmisję ACK. 


Sygnał ACK (ang. acknowledge) jest zwykle generowany przez urządzenie będące odbior- 
nikiem, a STB przez urządzenie będące nadajnikiem. Rozpatrzmy teraz dwa przypadki 
współpracy sterownika z urządzeniami zewnętrznymi. Pierwszy przypadek dotyczyć będzie 
urządzenia wejściowego a drugi urządzenia wyjściowego. 
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Rysunek 6.5. Połączenie sterownika z urządzeniem wejściowym: a) struktura i b) wykres czasowy 
przesyłania znaku 


Urządzenie 


Na rysunku 6.5 pokazano połączenie sterownika z urządzeniem oraz przebiegi czasowe 
na tym łączu i łączu z systemem (sygnały INT i RD). Jeżeli sterownik zezwala na 
transmisję (ACK = 0), to urządzenie wejściowe, które jest nadajnikiem, może wysłać bajt 
wraz ze strobem STB. Sterownik odbiera ten bajt i zapisuje go do swego wewnętrznego 
rejestru potwierdzając ten fakt zmianą stanu sygnału ACK. Jednocześnie zgłasza on do 
procesora sygnał przerwania INT. Procesor po odebraniu sygnału INT musi dokończyć 
cykl wykonania aktualnego rozkazu, w czasie którego przyszło zgłoszenie przerwania, 
a następnie rozpoczyna obsługę tego przerwania. Obsługa rozpoczyna się od wykonania 
rozkazu skoku do miejsca, gdzie znajduje się początek podprogramu obsługi przerwania 
tego urządzenia. Aby wykonać ten rozkaz procesor musi otrzymać od sterownika numer 
urządzenia wejściowego, który jest zamieniany na odpowiedni adres. Dlatego procesor 
wykonuje cykl odczytu wysyłając sygnał INTA, a w tym czasie sterownik wysyła swój 
numer na magistralę danych. Zasadniczym rozkazem podprogramu obsługi takiego 
przerwania jest rozkaz IN (jeżeli adresy urządzeń zewnętrznych znajdują się w obszarze 
pamięci, to dowolny inny rozkaz dotyczący odczytu komórki pamięci). Rozkaz ten 
powoduje, że procesor wysyła na systemową magistralę adresową adres sterownika, a na 
magistralę sterującą strob odczytu RD. W ten sposób odczytana zostanie zawartość rejestru 
buforowego sterownika. Wówczas sterownik zmienia wartość sygnału INT, co wskazuje, 
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że przerwanie obsłużono oraz wartość sygnału ACK, co wskazuje na zakończenie trans- 
misji. Cały układ jest wówczas przygotowany do powtórzenia opisanego cyklu transmisji. 


Na rysunku 6.6 pokazano połączenie sterownika z urządzeniem wyjściowym. W tym 
przypadku urządzenie zewnętrzne jest odbiornikiem. Przebiegi czasowe rozpatrzono od 
momentu kiedy procesor zapisał bajt do rejestru buforowego sterownika. W tym celu 
założono, że już wcześniej sterownik zgłosił przerwanie. W czasie obsługi tego przerwania 
procesor wykonuje rozkaz OUT wysyłając na magistralę adresową numer tego sterownika, 
a na magistralę danych przesyłany bajt. Wraz z bajtem danych procesor wysłał na magist- 
ralę sterującą strob zapisu WR. Zapis tej informacji do rejestru buforowego sterownika 
powoduje zmianę stanu na linii przerwania INT, co wskazuje na to, że przerwanie już 
obsłużono. Wówczas sterownik wysyła do urządzenia wyjściowego zawartość rejestru 
buforowego (zapisany bajt) wraz ze strobem STB. Urządzenie odczytuje bajt i zmienia 
stan linii ACK, aby nie dopuścić do przesłań dalszych bajtów. Gdy urządzenie jest gotowe 
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Rysunek 6.6. Połączenie sterownika z urządzeniem wyjściowym: a) struktura i b) wykres czasowy 
przesyłania znaku 


do przyjęcia następnego bajtu, to wysyła potwierdzenie tego faktu sygnałem ACK. 
Sterownik odbierając ten sygnał ponownie zgłasza przerwanie do procesora, który wy- 
konując podprogram obsługi ponownie zapisze rejestr buforowy sterownika. 


Przedstawione tryby pracy z sygnałami STB i ACK noszą nazwę transmisji z potwier- 
dzeniem (ang. handshaking). Typowym przykładem takiego łącza jest standardowe łącze 
drukarki zwane łączem typu Centronics. Sterownik takiego łącza przesyła bajt wraz 
z sygnałem strobu STB. Jeżeli pamięć buforowa drukarki, o pojemności równej przykła- 
dowo liczbie znaków w drukowanym wierszu, nie jest zapełniona, to po 6 us sterownik 
wysyła do procesora ponownie sygnał potwierdzenia ACK i czeka na dalszą transmisję. 
Jeżeli natomiast bufor zapełniono, to drukarka wysyła wysoki (aktywny) poziom na 
specjalne wyjście BUSY, blokując dalsze transmisje. Łącze to jest wyposażane jeszcze 
w dodatkowe sygnały sterujące. Jednym z nich jest wyjściowy sygnał sterownika RESET 
ustawiający stan początkowy drukarki. W łączu są także sygnały wejściowe sterownika, 
jak np. sygnał PAPER OUT (zgłoszenie braku papieru) i sygnał ERROR (sygnał zgłoszenia 
powstałego błędu). Innym typowym łączem jest łącze stosowane dla przyrządów 
pomiarowych współpracujących z komputerem, które opracowano w firmie Hewllet- 
-Packard i znane jest pod nazwą HPIB (ang. Hewillet-Packard Interface Bus) lub jako 
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standard IEEE-488 lub IEC-625. Jest to także łącze równoległe przeznaczone dla transmisji 
znakowych (bajtowych) z potwierdzaniem. 


Niekiedy istnieje potrzeba współpracy procesora z prostymi układami wejścia lub 
wyjścia, jak np. wyświetlacz diodowy jako układ wyjściowy lub przekaźnik jako układ 
wejściowy. Stosowane są wówczas prostsze, niż już opisane, sterowniki pracujące bez 
potwierdzania. Są to zwykle rejestry umieszczone w odpowiednim miejscu obszaru adre- 
sowego (odpowiednio dołączone do magistrali adresowej). Współpraca procesora z takimi 
rejestrami odbywa się poza systemem przerwań i są one albo zapisywane rozkazem OUT 
z właściwym adresem albo odczytywane rozkazem IN. 


6.4.3. STEROWNIK STANDARDOWEGO ŁĄCZA SZEREGOWEGO 


Łącze szeregowe służy do transmisji informacji na duże odległości (kilku lub kilku- 
dziesięciu metrów), a także na bardzo duże odległości (setek i więcej metrów), jeśli 
zastosuje się specjalne urządzenie transmisyjne, tzw. modem. Sterownik łącza szerego- 
wego współpracuje z magistralą systemową w podobny sposób jak sterownik łącza równo- 
ległego. Sterownik jest wyposażony w układ zamiany równoległej postaci informacji na 
postać szeregową (przy nadawaniu) i zamiany szeregowej na równoległą (przy odbiorze). 
Łącze pomiędzy urządzeniem a sterownikiem zależy od rodzaju transmisji jaka jest sto- 
sowana dla danego urządzenia. Stosowane są dwa rodzaje transmisji: 

— transmisja asynchroniczna, 

— transmisja synchroniczna. 


TRANSMISJA ASYNCHRONICZNA 


Transmisję asynchroniczną stosuje się do przesłań pojedynczych bajtów, a więc do współ- 
pracy z urządzeniami wolnymi. Jednostką szybkości transmisji jest baud (czyt. bod). 
Odpowiada ona liczbie transmitowanych bitów na sekundę. Typowymi wartościami szyb- 
kości transmisji asynchronicznej są 300 b/s, 1200 b/s, 4800 b/s, 9600 b/s, 19,2 Kbitów/s. 
Transmisja asynchroniczna polega na przesyłaniu danych bez oddzielnej synchronizacji 
sygnałem zegarowym. Zakłada się, że generator odbiornika ma zbliżoną częstotliwość do 
częstotliwości generatora nadajnika. Ponieważ w rzeczywistości te częstotliwości są różne, 
więc tylko przez krótki czas (czas trwania kilku bitów) da się utrzymać synchronizację 
transmisji. Synchronizacja polega na strobowaniu przesyłanej informacji za pomocą 
generatora odbiornika. Strobuje się w środku czasu trwania poszczególnych bitów 
(wysyłanych w takt generatora nadajnika). Ze względu na różnice częstotliwości 
generatorów nadajnika i odbiornika, po kilku bitach strob wypadnie poza czasem trwa- 
nia bitu. 
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Rysunek 6.7. Synchronizacja przebiegu nadawanego i odbieranego w czasie transmisji asynchronicznej 
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Na rysunku 6.7 pokazano przebieg naprzemiennych zer i jedynek synchronizowany 
przebiegiem zegarowym nadajnika. Załóżmy, że zegar odbiornika różni się o ok. 10%. 
Przy takim założeniu (oraz przy założeniu, że pierwszy bit jest zsynchronizowany dokład- 
nie) odczyt dziesiątego bitu może być już nieprawidłowy, gdyż dodatnie, synchronizujące 
zbocze zegara odbiornika wychodzi poza przedział czasowy dziesiątego bitu. Dla takiej 
różnicy częstotliwości zegarowych nieprawidłowo zostanie odczytany na pewno bit szósty 
i dalsze. Dla transmisji 10 bitów różnica częstotliwości nie może być zatem większa niż 
10%. W przypadku, gdy warunek taki nie może być spełniony lub transmitowany ciąg ma 
być dłuższy, to stosuje się transmisję synchroniczną. 
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Rysunek 6.8. Przebieg czasowy transmisji asynchronicznej 


Przebieg transmisji asynchronicznej jednego znaku pokazano na rysunku 6.8. Trans- 
misja zaczyna się od momentu zmiany poziomu przebiegu z wysokiego na niski. Zmiana 
ta wyzwala generator odbiornika tak, aby pierwszy bit był prawidłowo zsynchronizowany. 
Ponieważ początek transmisji zaczyna się zawsze od stanu 0 (załóżmy, że niski poziom 
odpowiada 0), to bit ten nie może należeć do transmitowanego znaku i jest traktowany 
jako bit startu. Dopiero następne bity są odczytywane przez odbiornik. Liczba transmito- 
wanych bitów zależy od systemu i waha się od 6 do 9 (na rys. 6.8 jest ich 9). Każdy znak 
(5 do 8 bitów) może być uzupełniony bitem parzystości (lub nieparzystości). Po ostatnim 
bicie następuje zawsze bit stopu, któremu odpowiada poziom wysoki. Po zakończeniu 
czasu trwania tego bitu wysoki poziom napięcia pozostaje aż do momentu rozpoczęcia 
następnej transmisji. Generator odbiornika oczekuje na nowy znak, tj. obserwuje zmianę 
poziomu z 1 na 0. Jeżeli w momencie zakończenia czasu trwania bitu stopu generator 
odbiornika nie jest gotowy do przyjęcia ewentualnej zmiany stanu z wysokiego na niski, to 
można zwiększyć długość bitu stopu. Są trzy typowe długości tego bitu: pierwsza równa 
pojedynczej długości bitu danych, druga równa półtora jego długości i trzecia równa 
dwóm długościom bitu danych. 


Celem podwyższenia dokładności synchronizacji generatora odbiornika jest on często 
projektowany na częstotliwości większe niż częstotliwość transmisji. Stosuje się dzielniki 
8, 16, 32 i 64. W takim sterowniku częstotliwość generatora jest dzielona przez odpowiedni 
dzielnik w układzie licznika. Moment próbkowania, czyli impuls strobujący, łatwo otrzy- 
mać z odpowiedniego wyjścia dekodera stanów tego licznika. 


TRANSMISJA SYNCHRONICZNA 


Transmisja synchroniczna polega na tym, że wraz z przesyłaniem danych nadajnik wysyła 
do odbiornika przebieg zegarowy celem synchronizacji pracy generatora odbiornika. 
Istnieją dwa podstawowe sposoby synchronizacji: 

— przebieg zegarowy jest wysyłany dodatkową linią, 

— przebieg zegarowy jest zakodowany w samym przebiegu danych. 


Wadą pierwszego rozwiązania jest konieczność użycia dodatkowego przewodu, a zaletą 
łatwość synchronizacji. Wadą drugiego rozwiązania jest komplikacja układu sterownika, 
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Rysunek 6.9. Kodowanie informacji w kodzie Manchester 


gdyż kodowanie (i dekodowanie) przebiegu danych wymaga dodatkowego sprzętu. Istnieje 
wiele sposobów zakodowania danych wraz z przebiegiem zegarowym, ale tutaj zaprezento- 
wano tylko jeden z nich. 


Na rysunku 6.9 pokazano przykładowy sposób wspólnego zakodowania przebiegu 
danych i zegara, zwany kodem Manchester. Kod ten ma taką cechę, że w środku czasu 
trwania bitu następuje zmiana poziomu napięcia bez względu na wartość tego bitu. Re- 
prezentacją 1 jest zmiana poziomu z niskiego na wysoki, a 0 z wysokiego na niski. Jeżeli 
sąsiednie bity mają tą samą wartość, to aby ta reprezentaja była spełniona, zmiana poziomu 
musi nastąpić także na początku czasu trwania bitu. Jeżeli natomiast sąsiednie bity mają 
przeciwne wartości, to na początku czasu trwania bitu zmiana nie następuje. Dlatego 
przebieg taki ma dwie podstawowe składowe częstotliwości: jedną równą częstotliwości 
generatora nadajnika (dla ciągu samych 0 lub samych 1) i drugą dwa razy mniejszą (dla 
naprzemiennego ciągu 0 i 1). Taki zapis ma własność samosynchronizacji, tj. z dowolnego 
przebiegu zerojedynkowego można w odbiorniku uzyskać przebieg zegarowy, który będzie 
zgodny z zegarem nadajnika. Przebieg zegarowy w odbiorniku można otrzymać dekodując 
odpowiednio przebieg danych za pomocą specjalnych układów (Czytelnikowi zaleca się 
próbę samodzielnego zaprojektowania takiego układu). Do synchronizacji generatora 
odbiornika przebiegiem zegarowym stosuje się układy zwane układami PLL (ang. phase 
locked loop). Są to generatory, które podstrajają swoją częstotliwość wyjściową do często- 
tliwości wejściowej. Ponieważ proces ten zachodzi przez cały czas transmisji, więc długość 
jej nie jest ograniczona niestabilnością generatora zegara. 


Łącze szeregowe pomiędzy sterownikiem a urządzeniem zewnętrznym wykorzystuje 
różne sygnały w zależności od tego czy urządzenie jest nadajnikiem, czy odbiornikiem. 


a b 


Nadajnik 


Rysunek 6.10. Współpraca sterownika łącza szeregowego z urządzeniem 


Na rysunku 6.10 pokazano współpracę sterownika z odbiornikiem i nadajnikiem za pomocą 
prostego łącza szeregowego. Łączem powszechnie stosowanym jest standard RS-232C 
opracowany przez Electronic Industries Association. Polska Norma PN-75 T-05052 przyjęła 
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ten standard pod nazwą Styk S2. Standard określa połączenie dwóch urządzeń: urządzenia 
komunikacyjnego DCE (ang. data communication equipment) i urządzenia końcowego 
DTE (ang. data terminal equipment). W komputerach urządzeniem DCE jest zwykle 
sterownik dołączony do magistrali komputera, a urządzeniem DTE jest urządzenie ze- 
wnętrzne, np. modem. Sygnały łącza RS-232C są przesyłane łączówką 25-krotną, gdzie 
wyróżnia się cztery podstawowe grupy linii: 

1) linie danych, 

2) linie sterujące, 

3) linie zegarowe, 

4) linie zasilania. 


Linie danych to dwie linie: linia nadawania T,D i linia odbiorcza R D. 


Linie sterujące można podzielić na dwie grupy: cztery linie sterowania transmisją 
i trzy linie dla sygnałów pomocniczych. Linie sterowania transmisją to dwie linie Wyjścio- 
we sterownika: 


RTS — żądanie nadawania (ang. request to send), 

DTR — potwierdzenie gotowości odbioru (ang. data terminal ready) i dwie linie 
wejściowe sterownika: 

DSR — żądanie gotowości do odbioru (ang. data set ready), 

CTS — potwierdzenie gotowości odbiornika (ang. clear to send). 


Pomocniczymi sygnałami sterującymi są: 
CD — sygnał kontroli transmisji wysyłany przez modem (ang. carrier detector) 
i sygnalizujący właściwy poziom napięcia sygnału odebranego, 
SQD — sygnał wskazujący na wysokie prawdopodobieństwo błędu (ang. signal 
quality detector), 
RI — sygnał wskazujący na odebranie przez modem sygnału zewowego 
w łączu telefonicznym (ang. ring indicator). 


Linie zegarowe stanowią trzy sygnały. Dwa sygnały zegarowe TSET (ang. transmitter 
signal element timing) wskazujące środek przedziału czasowego przeznaczonego dla 
jednego bitu. Jeden z nich jest wysyłany przez modem i drugi przez sterownik. Trzeci 
sygnał RSET (ang. receiver signal element timing) wskazuje środek przedziału czasowego 
każdego odebranego bitu. 


Linie zasilania to dwie linie masy: jedna to tzw. masa ochronna dla ewentualnego 
połączenia jej z masami innych urządzeń i druga linia to tzw. masa wspólna będąca 
potencjałem odniesienia dla wszystkich sygnałów. 


Pozostałe linie łącza są częściowo przeznaczone na zdublowanie niektórych syg- 
nałów, a częściowo pozostają niezdefiniowane. Na rysunku 6.10 przedstawiono dwie 
konfiguracje łącza szeregowego RS-232. Na rysunku 6.10a sterownik jest nadajnikiem 
a modem odbiornikiem, a na rysunku 6.10b sterownik jest odbiornikiem a modem nadajni- 
kiem. Nałeży zwrócić uwagę na połączenia linii sterujących. Transmisja zaczyna się od 
nadajnika sygnałem żądania RTS. Odbiornik odbiera ten sygnał na wejściu DSR i gdy jest 
gotowy, to wysyła sygnał DTR. Nadajnik odbiera go na wejściu CTS i wówczas może 
rozpocząć się transmisja. Całe łącze RS-232 jest złożeniem obu pokazanych na ry- 
sunku 6.10 połączeń. 
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6.5. PROTOKOŁY TRANSMISJI 


6.5.1. RODZAJE PROTOKOŁÓW 


Transmisje danych pomiędzy dwoma stacjami składają się zwykle z długiego ciągu znaków 
(bajtów). W ogólnym przypadku przesyłane ciągi informacji mogą mieć różną długość. 
Celem umożliwienia kontroli poprawności transmisji wprowadza się pewne mechanizmy 
ułatwiające opis takiego ciągu. Zasady transmisji (sterowanie, synchronizacja, sprawdzanie 
poprawności itp.) nazywane są protokołem, a sam ciąg informacji wraz z opisem komu- 
nikatem (ang. message). Na początku i na końcu transmisji przesyłana jest specjalna 
informacja zwana znakami sterującymi (ang. control characters). Ich znaczenie zależy od 
rodzaju transmisji. Wyróżnia się dwa rodzaje transmisji: transmisję bitową (ang. bit- 
-oriented protocols) oraz transmisję znakową (ang. character oriented protocols). Kolejno 
przedstawiono oba rodzaje transmisji. 


6.5.2. TRANSMISJA BITOWA 


Transmisja bitowa polega na tym, że w komunikacie nie wyróżnia się poszczególnych 
znaków (bajtów), a tylko w całym ciągu informacji, zwanym ramką (ang. frame) wydziela 
się odpowiednie pola. Na rysunku 6.11 pokazano ramkę protokołu HDLC (ang. high- 


bajt adres słowo informacja CRC bajt 
synchronizacji| odbiornika sterujące transmitowana synchronizacji 


Rysunek 6.11. Protokół HDLC 


-level data link control) 1 przyjętego jako standard przez organizację normalizacyjną ISO 
(ang. International Standard Organization). Firma IBM wprowadziła podobny standard 
zwany SDLC (ang. synchronous data link control). Ramka protokołu HDLC jest podzielona 
na 6 pól. Pierwsze trzy pola są 8-bitowe, a znaczenie ich jest następujące: 
— pole znacznika synchronizacji (ang. flag) zawierające bajt 01111110 służący syn- 
chronizacji generatora odbiornika, 
— pole adresowe wskazujące adres odbiornika, dla którego jest przeznaczony dany 
komunikat, 
— pole słowa sterującego, które określa funkcję i przeznaczenie ramki. 


Czwartym polem jest pole informacyjne, którego długość nie jest niczym ograniczona. 
Zawartość tego pola jest odczytywana przez odbiornik. Następnym, piątym polem jest 
dwubajtowe pole zawierające znak CRC, które służy odbiornikowi dla wykrycia i ewen- 
tualnego poprawienia błędów transmisji. Całą ramkę zamyka szóste pole, w którym 
znajduje się ponownie bajt znacznika synchronizacji (identyczny jak pierwszy bajt ramki). 
Jeśli dwie ramki są transmitowane bezpośrednio jedna za drugą, to końcowy znacznik 
synchronizacji może pełnić jednocześnie rolę pierwszego znacznika synchronizacji 
następnej ramki. W czasie przerwy pomiędzy ramkami mogą być przesyłane znaczniki 
synchronizacji lub ciąg jedynek. Jeśli liczba jedynek przekroczy 15, to stan magistrali 
może zostać potraktowany jako nieaktywny. 
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Znacznik synchronizacji w omawianym protokole przyjęto jako 01111110, co zmusiło 
projektantów tego protokołu do znalezienia sposobu prawidłowego przesłania takiego 
ciągu danych (uniknięcia takiej sekwencji w innych polach). Sposób ten polega na wsta- 
wianiu dodatkowego i nie znaczącego zera po każdych pięciu jedynkach ciągu danych. 
Nadajnik jest wyposażony w specjalny układ wstawiania takiego 0, a oczywiście odbiornik 
jest wyposażony w układ odrzucania tego 0 po każdych pięciu jedynkach. Na przykład 
jeżeli trzeba dokonać transmisji ciągu 7 jedynek, to w rzeczywistości nadajnik wysyła ciąg 
11111011. 


Jak widać z rysunku 6.11 adres odbiornika jest 8-bitowy, co pozwala na zakodowanie 
adresów 256 urządzeń. Jeśli w systemie pracuje więcej urządzeń, to protokół zezwala na 
wydłużenie pola adresowego, pod warunkiem, że ostatni bit pola adresowego będzie 
zawsze zerem. Wtedy następny bajt będzie traktowany jako bajt adresowy. Jeśli zaś 
pierwszy bajt adresu jest zakończony 1, to oznacza, że adres jest jednobajtowy. Oczywiście, 
przyjęcie takiego system ogranicza do 128 liczbę urządzeń adresownych jednobajtowo. 


Bardzo ważną rolę odgrywa słowo sterujące. Określa ono rodzaj komunikatu. Dla 
każdego rodzaju komunikatu słowo to ma inny format. Są trzy rodzaje komunikatów: 

1) komunikat informacyjny, 

2) komunikat nadzorczy, 

3) komunikat sterujący. 


KOMUNIKAT INFORMACYJNY 


Komunikat informacyjny jest ramką, której zawartość ma zostać odczytana przez od- 
biornik. Nadajniki i odbiorniki w systemie komputerowym nazywane są stacjami. W zależ- 
ności od konfiguracji stacji w systemie można różnie przesyłać komunikaty. Konfiguracja 
systemu jest określona połączeniami pomiędzy stacjami. W czasie transmisji stacja może 
być stacją główną (ang. primary station) lub stacją podrzędną (ang. secondary station). 
Wyróżnia się przesłania pomiędzy dwiema stacjami (ang. point-to-point configuration) 
i przesłania pomiędzy wieloma stacjami (ang. multipoint configuration). W zależności od 
konfiguracji komunikaty informacyjne są przesyłane w trzech trybach, zwanych trybami 
odpowiedzi. W zależności od nich następuje dalsza reakcja (odpowiedź) w systemie 
transmisji. Wyróżnia się: 

— tryb odpowiedzi zwykłej (normalnej) NRM (ang. normal response mode), 

— tryb odpowiedzi asynchronicznej ARM (ang. asynchronous response mode), 

— tryb odpowiedzi asynchronicznej podwójnej ABM (ang. asynchronous balanced 

mode). 


Transmisje NRM i ARM są stosowane do przesłań pomiędzy dwiema stacjami lub do 
przesłań z wyróżnioną stacją główną. W tym przypadku stacja główna jest odpowiedzialna 
za inicjalizację transmisji, sterowanie transmisją do/z stacji podrzędnych oraz za odłączanie 
stacji podrzędnych. W trybie NRM stacje podrzędne transmitują tylko na żądanie stacji 
głównej. W trybie ARM stacja podrzędna może zainicjować transmisję. W trybie ABM 
każda stacja może być zarówno stacją główną, jak i stacją podrzędną. Stacja nadawcza 
transmitując kolejne ramki wysyła do stacji odbiorczej także numery tych ramek. Stacja 
odbiorcza sprawdza poprawność transmisji i potwierdza nadajnikowi każdą bezbłędnie 
odebraną ramkę. Ponieważ potwierdzenia są naprzemienne w czasie z samymi transmis- 
jami, to stacja nadawcza przesyła stacji odbiorczej nie tylko numer kolejnej ramki, ale 
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słowo sterujące ramki nadzorczej 


Rysunek 6.12. Słowa sterujące dla różnego rodzaju ramek 


i numer ramki, której potwierdzenia się spodziewa. Te informacje są zawarte w słowie 
sterującym. | 


Słowo sterujące ramki informacyjnej ma postać jak w rysunku 6.12. Najbardziej 
znaczący bit jest zawsze zerem. Po nim następują trzy bity numeru ramki nadawanej NN. 
Następny bit PF ma dwa znaczenia, w zależności od rodzaju stacji, która wysyła to słowo. 
Jeśli stacja nadrzędna wysyła słowo sterujące z jedynką na tej pozycji PF = 1 (ang. poli), 
to oznacza dla stacji podrzędnej, że żąda od niej odpowiedzi. Typowe transmisje przebie- 
gają ze słowem sterującym, które ma na tej pozycji jedynkę. Jeśli słowo to jest wysyłane 
przez stację podrzędną, to jedynka na tej pozycji PF = 1 (ang. final) oznacza, że przesyłana 
ramka jest ramką ostatnią. Ostatnie trzy bity stanowią numer ostatnio potwierdzonej, 
a więc poprawnie odebranej ramki. 


KOMUNIKAT NADZORCZY 


Jeśli pierwsze dwa bity w słowie sterującym są 1 i 0, to oznacza, że przesyłany komunikat 
jest komunikatem nadzorczym, a więc jest to przesłanie rozkazu. Dwubitowe pole, ozna- 
czone na rys. 6.12 napisem „Kod , określa jeden z czterech rozkazów. Rozkazy te są 
wysyłane przez odbiornik i informują o jego stanie. Jeśli wartość tych bitów jest 00, to 
odbiornik informuje o swojej gotowości. Jeśli jest 10, to oznacza niegotowość odbiornika. 
Jeśli jest 01, to odbiornik potwierdza przyjęcie ramek do numeru NO-1, tj. pomniejszonej 
o l zawartości pola N0. Jednocześnie odbiornik żąda przesyłania ramek począwszy od 
numeru NO. Jeśli wreszcie wartość tych bitów jest 11, to odbiornik żąda przesłania ramki 
o numerze NO. 


KOMUNIKAT STERUJĄCY 


Jeśli w słowie sterującym wartość pierwszych dwóch bitów jest 11, to przesyłana ramka 
jest ramką sterującą. Jej znaczenie jest różne w zależności od tego czy jest wysyłana przez 
stację główną, czy przez podrzędną. Oba pola z napisem „Kod” (w sumie pięciobitowe) są 
polami kodu operacji. Można zatem zakodować 32 rozkazy. Jeśli ramka jest wysyłana 
przez stację główną, to są to rozkazy inicjalizacji stacji podrzędnej, rozłączenia połączenia, 
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kasowania poprzednio wysłanych rozkazów, zmiany trybu pracy itp. Jeśli ramka jest 
wysyłana przez stację podrzędną, to są to odpowiedzi dla stacji głównej. Na przykład 
może to być odpowiedź informująca o powstałych błędach. Komunikaty sterujące mają 
zatem charakter pomocniczy względem samej transmisji. 


PRZYKŁAD WSPÓŁPRACY DWÓCH STACJI 


Na rysunku 6.13a zilustrowano przebieg transmisji pomiędzy dwoma stacjami. Po lewej 
stronie rysunku symbolicznie zaznaczono stację główną A, a po prawej stację podrzędną 
B. Zakłada się pracę w półdupleksie. Współpraca zaczyna się od wysłania ramki infor- 
macyjnej ze stacji A do B. Przy strzałce reprezentującej transmisję zaznaczono zawartość 


zakłócenie 


Rysunek 6.13. Przesyłanie komunikatów przy transmisji szeregowej 


słowa sterującego ramki. Pierwsza transmisja jest wysyłana ze słowem sterującym, 
w którym wartość NN =0, P=0 i NO=0. Dla następnych transmisji zwiększa się tylko 
numer komunikatu NN, aż do momentu kiedy zaprogramowano transmisję wraz z bitem 
P=1, tj. z żądaniem aby stacja B potwierdziła odebrane komunikaty. Załóżmy, że ramkę 
z numerem NN = 2 nieprawidłowo odebrano. Wówczas stacja podrzędna wysyła komunikat 
nadzorczy ze słowem sterującym, w którym jest rozkaz powtórzenia źle odebranej ramki. 
Stacja może wysłać rozkaz z kodem 11 (por. opis komunikatu nadzorczego) lub z ko- 
dem 01. Są to odpowiednio komunikat nadzorczy lub komunikat sterujący. Na rysunku 6.13 
pokazano ten pierwszy przypadek, tj. stacja podrzędna żąda powtórzenia transmisji ramki 
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NN =2. Żądanie zawiera bit PF = 1, co oznacza, że stacja nie otrzymała więcej komunika- 
tów. Wówczas stacja główna wysyła ponownie ramkę z numerem 2. Ponieważ w tej ramce 
jest bit PF = 1, to zmusza to stację podrzędną do odpowiedzi. Należy zauważyć, że 
wartość NO jest znowu równa 0. Stacja podrzędna musi potwierdzić zarówno ramkę 
o numerze 2, jak i o numerze 3. Załóżmy, że stacja podrzędna ma do wysłania dwa 
komunikaty. W takim przypadku potwierdzenie może zostać przesłane w komunikacie 
informacyjnym. W drugim komunikacie jest bit PF = 1, co świadczy o tym, że stacja B nie 
ma już więcej komunikatów. Stacja A nadaje wtedy ponownie swoje komunikaty. 


Załóżmy, że w drugim komunikacie pojawi się bit PF=1, a więc stacja żąda potwier- 
dzenia odbioru. Załóżmy ponadto, że stacja B ma do przesłania dwa nowe komunikaty i że 
podczas transmisji pierwszego powstał błąd. Na żądanie potwierdzenia stacja A odpowiada 
komunikatem nadzorczym żądając powtórzenia (pierwsze bity równe 11) ramki o numerze 
2 i żądając potwierdzenia (PF = 1). Ramka jest przesyłana z bitem PF = 1, gdyż nie ma 
dalszych ramek do transmisji. 


Na rysunku 6.13b pokazano przykład transmisji dupleksowej, gdzie stacja A przesyła 
komunikat do stacji B i jednocześnie stacja B przesyła komunikat do stacji A. Wydaje się, 
że Czytelnik potrafi teraz sam prześledzić ciąg komunikatów. 


6.5.3. TRANSMISJA ZNAKOWA 


Transmisja znakowa jest stosowana głównie przy przesyłaniu kodu znakowego ASCII. 
Jednym ze stosowanych protokołów jest protokół BISYNC. Ramka tego protokołu składa 
się z 8 pól i jest pokazana na rysunku 6.14. Pierwsze dwa pola ramki stanowią dwa znaki 
synchronizacji. W kodzie ASCII są to słowa 00010110, gdzie najbardziej znaczący bit 
(lewy) jest bitem parzystości. Słowo tak wybrano, że siedmiokrotne przesuwanie cykliczne 
nie spowoduje otrzymania pierwotnego układu bitów. Dopiero ósme przesunięcie spowodu- 
je otrzymanie powtórzenia słowa pierwotnego. Rozpoczynając transmisję nadajnik wysyła 
dwa słowa synchronizacji. Podczas transmisji odbiornik w specjalnym rejestrze prze- 
chowuje aktualny bajt, czyli ostatnio odczytane 8 bitów. Obserwacja ostatnich 8 bitów jest 
konieczna do stwierdzenia, czy nadszedł znak synchronizacji czy nie. Jeśli w rejestrze 
znajdzie się znak synchronizacji, to odbiornik wykorzystuje ten moment dla podsynchro- 
nizowania własnego generatora. Ponieważ może się zdarzyć, że końcówka jakiegoś znaku 
i początek następnego tworzą słowo synchronizacji, to aby uniknąć potraktowania tego 
złożenia jako znaku synchronizacji, w ramce stosowane są dwa słowa synchronizacji. 


Następnym znakiem, po znakach synchronizacji, jest bajt 00000001 czyli znak SOH 
(ang. start of header). Jest to znak sygnalizujący rozpoczęcie nagłówka. Nagłówek składa 
się z trzech części: z adresu odbiornika, z liczby będącej długością transmitowanego ciągu 
i ze znaku STX (ang. start of text) kończącego nagłówek i wskazującego na rozpoczęcie 
transmisji tekstu. Następnie przesyłany jest właściwy tekst. Po nim następuje znak końca 


Rysunek 6.14. Ramka komunikatu protokołu BISYNC 
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Tablica 6.1. Przykładowa transmisja znakowa 


Kod Komentarz 


00010110 SYN znak synchronizacji 
00010110 SYN znak synchronizacji 
00000001 SOH początek nagłówka 


00110011 2 adres odbiornika (2) 
00111000 8 liczba transmitowanych znaków tekstu (8) 
00000010 STX początek transmisji 


01001110 
01000001 
01011010 
01010111 
01001001 
01010011 
01001010 
01001111 


tekst 


OA4A0-—- SNP Z 


10000011 ETX koniec transmisji tekstu 
00110000 LRC znak parzystości wzdłużnej 


tekstu ETX (ang. end of text). Cała transmisja jest kończona znakiem BCC (ang. block 
check character), który jest najczęściej bitem parzystości wzdłużnej, tj. bitem parzystości 
dla wszystkich bitów ramki. Znak BCC może być także słowem CRC. 


W tablicy 6.1 pokazano przykład transmisji znakowej. Ramka jest przeznaczona dla 
odbiornika o adresie 2, a długość pola tekstu wynosi 8 znaków. Transmitowane jest słowo 
„NAZWISKO. 


6.6. BEZPOŚREDNIA TRANSMISJA DO PAMIĘCI 


Szybkie urządzenia zewnętrzne współpracują z komputerem na zasadzie bezpośredniego 
dostępu do pamięci DMA. Urządzenie żądające takiej transmisji zgłasza ten fakt do 
specjalnego sterownika. Sterownik ten spełnia funkcje nadzorujące transmisje pomiędzy 
urządzeniem zewnętrznym i pamięcią. Zadaniem takiego sterownika jest wysłanie, na 
żądanie urządzenia zewnętrznego, sygnału wstrzymania pracy procesora (HOLD) jako 
inicjalizacji transmisji. Procesor po przyjęciu tego sygnału generuje do sterownika sygnał 
potwierdzenia HLDA i odłącza się od magistrali (jego linie przechodzą w stan trzeci). 
W tym momencie sterownik transmisjj DMA musi przejąć zarządzanie magistralą. 
Zarządzanie polega na generacji odpowiednich adresów i odpowiednich sygnałów steru- 
jących. Ponieważ w komputerze często jest wiele urządzeń, które mogą jednocześnie 
żądać transmisji DMA, to sterowniki DMA buduje się jako wielokanałowe, tj. wyposażone 
w wiele (np. 4) wejść żądań transmisji. 
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Sterownik Sterownik 
| pa 


Rysunek 6.15. Współpraca bloków komputera podczas transmisji DMA 


Na rysunku 6.15 pokazano konfigurację systemu komputerowego zawierającego ste- 
rownik transmisji DMA. Na rysunku wyróżniono sygnały szyny sterującej, które biorą 
udział w inicjalizacji transmisji DMA. Przykładowy sterownik dysku wysyła sygnał żąda- 
nia transmisji DRQ (ang. DMA request) do sterownika DMA, który na tej podstawie 
wysyła do procesora sygnał żądania wstrzymania HOLD. Po zakończeniu cyklu maszyno- 
wego, w czasie którego zgłoszono sygnał wstrzymania, procesor potwierdza wstrzymanie 
pracy wysyłając do sterownika sygnał HLDA. Sterownik DMA wysyła z kolei sygnał 
potwierdzenia transmisji DACK (ang. DMA acknowledge) do sterownika dysku. Wówczas 
zaczyna się transmisja, za którą odpowiedzialny jest sterownik DMA. Przejmuje on stero- 
wanie pracą systemu, tj. wysyła adresy pamięci i dwa stroby. Stroby te to albo: 

— strob odczytu pamięci i strob zapisu urządzenia zewnętrznego w czasie cyklu 

odczytu (odczytu pamięci), albo 

— strob zapisu pamięci i odczytu urządzenia zewnętrznego w czasie cyklu zapisu. 


Przed każdą transmisją odpowiedni kanał sterownika DMA musi zostać przez procesor 
zaprogramowany. Programuje się trzy podstawowe parametry transmisji: 

1) Kierunek przesyłania, 

2) długość transmisji, 

3) początkowy adres obszaru pamięci. 


Kierunek transmisji pomiędzy pamięcią a urządzeniem zewnętrznym zależy od cyklu 
DMA, tj. może to być odczyt (kierunek z pamięci do urządzenia) albo zapis (kierunek od 
urządzenia do pamięci). Niekiedy stosuje się tzw. cykl weryfikacji, który polega na tym, 
że po cyklu odczytu, tj. po zapisie urządzenia zewnętrznego, dokonuje się sprawdzenia 
poprawności zapisu. Cykl ten polega na tym, że odczytuje się informację poprzednio 
zapisaną i porównuje się ją z zawartością obszaru pamięci, która była transmitowana. 
Długość transmisji jest zaprogramowana jako liczba transmitowanych słów (lub bajtów) 
i określa liczbę dostępów do pamięci i jednocześnie liczbę adresów pamięci. Ponieważ 
przechowywanie wszystkich adresów byłoby bardzo nieefektywne, więc zawsze zakłada 
się spójny obszar pamięci. W takim przypadku do przeprowadzenia transmisji wystarczy 
znać długość transmisji i adres początkowy pamięci. Stosowane są dwie podstawowe 
techniki transmisji DMA: transmisja blokowa i transmisja kradzieży cykli. Transmisja 
blokowa (ang. burst mode) polega na tym, że przesłania DMA są prowadzone nie- 
przerwanie pomiędzy dwoma cyklami maszynowymi procesora. Technika kradzieży cykli 
(ang. cycle stealing) polega na tym, że pomiędzy dwoma cyklami maszynowymi procesora 
dokonywana jest transmisja DMA tylko jednego słowa. Technika ta pozwala na współ- 
bieżną pracę procesora i urządzenia żądającego transmisji DMA, a więc jednoczesnego 
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wykonywania programu i przesłań pomiędzy pamięcią i urządzeniem zewnętrznym. Po 
zakończonej transmisji sterownik DMA zwalnia magistralę i przekazuje sterowanie pro- 
CEeSOTOWI. 


Istnieją rozwiązania sterowników DMA umożliwiające przesłanie zawartości jakiegoś 
obszaru pamięci do innego obszaru za pomocą mechanizmu DMA. W takim przypadku 
sterowanie magistralą jest trudniejsze, gdyż trzeba dokonywać dwukrotnego adresowania. 
Najpierw trzeba przesłać adres źródłowej komórki pamięci i strob odczytu, a następnie 
przesłać adres docelowej komórki pamięci i strob zapisu. 


Trudniejszy problem powstaje, gdy w systemie komputerowym ma pracować duża 
liczba urządzeń zewnętrznych. Do wspomagania pracy procesora w komunikacji z urzą- 
dzeniami stosuje się wówczas specjalny układ zwany kanałem wejścia-wyjścia. Jeżeli 
w systemie komputerowym ma pracować wiele urządzeń zewnętrznych, to praca tych 
urządzeń przez przerwania lub przez DMA obniża efektywność obliczeniową komputera, 
ponieważ efektywny czas pracy procesora jest zmniejszany. Fakt ten odgrywa znaczącą 
rolę zwłaszcza w tzw. systemach wielodostępnych, gdzie wielu użytkowników jednocześnie 
korzysta z komputera. Właśnie w takich systemach jest wiele urządzeń znakowych (termi- 
nali), które współpracują z procesorem poprzez przerwania i wiele szybkich urządzeń 
(dyski), które pracują przez system DMA. Rozwiązaniem tego problemu jest zgrupowanie 
urządzeń zewnętrznych w dwie grupy: oddzielnie wolnych urządzeń znakowych 
i oddzielnie urządzeń szybkich transmitujących dane blokowo. Każdą z tych grup podłącza 
się do wspólnego dla nich sterownika. Takie rozbudowane sterowniki nazywają się kanała- 
mi i dzieli się je na dwa rodzaje: kanał multiplekserowy dla urządzeń znakowych i kanał 
selektorowy dla urządzeń szybkich. 


Kanał multiplekserowy może być kanałem n-wejściowym, gdzie n jest liczbą urządzeń 
współpracujących z kanałem. Każde urządzenie może współpracować z kanałem z inną 
szybkością. Zadaniem kanału jest utworzenie ciągu znaków z wszystkich urządzeń i prze- 
słanie ich do komputera. Załóżmy, że trzy urządzenia A, B i C wysyłają trzy ciągi znaków 


Kanał 


f Kanał 
multi- 


selektoro 
plekserowy kj 


Rysunek 6.16. Dwa rodzaje kanałów WE/WY 


10 — Podstawy budowy i działania komputerów 
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AG As Ag Az, Bp By By Bpr CG, 0, Cy Kanał odbiera te ciągi z różnymi 
szybkościami i tworzy jeden ciąg przesyłany do komputera, np. 


A, B,C,A„C;B, CA, CB: 
W tym przykładzie założono, że urządzenie C pracuje z największą szybkością. 


Kanał selektorowy współpracuje z szybkimi urządzeniami, więc w danej chwili tylko 
jedno z nich może być aktywne. Dlatego kanał ten jest wyposażony w jedną magistralę, do 
której dołączone są wszystkie urządzenia. Na rysunku 6.16 pokazano schematycznie 
połączenia sterowników urządzeń znakowych z kanałem multiplekserowym (rys. 6.16a) 
i sterowników urządzeń szybkich z kanałem selektorowym (rys. 6.16b). Z rysunku widać, 
że kanał selektorowy w jednym czasie obsługuje tylko jedno urządzenie, gdyż wszystkie 
urządzenia są dołączone do kanału przez wspólną szynę. Natomiast kanał multiplekserowy 
może jednocześnie obsługiwać wiele urządzeń zewnętrznych, gdyż każde z nich dołączone 
jest do innego wejścia kanału. 


ELEMENTY OPROGRAMOWANIA 
KOMPUTERÓW 


7.1. WYWOŁYWANIE PODPROGRAMÓW 


Przy omawianiu systemów przerwań często była mowa o wywoływaniu podprogramów. 
Podobnie programista projektując program czasami staje przed problemem, że pewne 
operacje (lub ciągi operacji) mają powtarzać się w wielu miejscach programu. Wówczas 
program staje się niepotrzebnie długi i skomplikowany. Aby efektywnie wykorzystać 
możliwości programowania komputerów wprowadzono mechanizm podprogramów 
(ang. subroutines). Jest to ciąg operacji zrealizowany w postaci oddzielnego programu tak 
skonstruowany, aby w odpowiednich miejscach programu głównego, zamiast wpisywania 
ciągu tych operacji, można było zapisać jedynie odwołanie do podprogramu. Taka kon- 
strukcja pozwala programiście napisać program składający się z dwóch części: programu 
głównego oraz podprogramów. W ogólnym przypadku podprogramów dołączanych do 
programu głównego może być wiele. W niektórych językach wyższego rzędu (np. FOR- 
TRAN) wyróżnia się dwie klasy podprogramów: jedną zwaną funkcją i drugą zwaną 
procedurą. 


Funkcją nazywa się taki podprogram, który jest wywoływany przez jego nazwę i który 
dla zmiennych wejściowych oblicza wartość wyjściową. Wartość ta jest następnie wy- 
korzystywana przez program główny. Na przykład wyrażenie 


POW(B1,B2) = BOKI * BOK2 


obliczające powierzchnię prostokąta, gdy dane są dwa jego boki jest funkcją. Jest to 
funkcja o nazwie POW i o dwóch zmiennych wejściowych B1 i B2. Program główny 
odwołuje się do tej funkcji przez nazwę podając wartości zmiennych wejściowych. Na 
przykład umieszczając w programie napis POW(2,3) otrzymamy, że w wyniku działania 
podprogramu zwracana będzie programowi głównemu wartość 6. 


Procedurą nazywa się podprogram, który dla programu głównego nie reprezentuje 
sobą jednej wartości, jak to było w przypadku funkcji. Procedura pozwala dla danych 
zmiennych wejściowych obliczyć ciąg wartości wyjściowych lub wykonać inne operacje. 
Wynikiem działania procedury może być na przykład usunięcie najmniejszej liczby z ciągu 
liczb. Innymi przykładami procedury, której argumentami jest ciąg liczb (wektor) może 
być procedura uporządkowania tych liczb w porządku rosnącym (wynikiem jest inny 
wektor) lub procedura wydrukowania jakiejś liczby. 


Dalej rozważono problem sterowania pracą procesora w czasie, gdy program odwołuje 
się do podprogramu. Wywołanie podprogramu może nastąpić w wielu różnych miejscach 
programu. Po wykonaniu podprogramu procesor powinien zapewnić powrót z podpro- 
gramu w odpowiednie miejsce programu głównego (to miejsce, z którego wywoływano 
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podprogram). Dlatego adresem powrotu musi być zawsze adres instrukcji następnej po 
instrukcji wywołującej podprogram. Procesor musi zatem zapewniać możliwość 
zapamiętywania adresu powrotu. Adres ten może być zapamiętywany w pamięci lub w 
rejestrze procesora. W każdym programie wywołanie podprogramu jest pewną sekwencją 
rozkazów zwaną sekwencją startową. Zadaniem tej sekwencji jest: 
— przygotowanie danych dla podprogramu (są to np. rozkazy zapisujące do rejestrów 
procesora lub do pamięci argumenty dla wywoływanego podprogramu), 
— przygotowanie miejsca na wynik podprogramu (są to np. rozkazy ustawiające 
adresy komórek pamięci, gdzie przesłano wyniki podprogramu), 
— skok do podprogramu wraz zapamiętaniem adresu powrotu, czyli np. rozkaz 
CALL. 


Po wykonaniu podprogramu zostaje wywołana w programie inna sekwencja rozkazów, 
zwana sekwencją czyszczącą. Zadaniem jej jest: 
— przyjąć wyniki z podprogramu, czyli np. zapisać je do pamięci, a w szczególności 
zwolnić rejestry procesora, 
— zwolnić miejsca w pamięci lub w rejestrach zarezerwowane na argumenty dla 
podprogramu. 


W samym podprogramie natomiast można wyodrębnić trzy części: początek podprogramu 
(zwany niekiedy prologiem), część zasadniczą (zwaną ciałem podprogramu) i zakończe- 
nie (zwane epilogiem). Początek podprogramu to zwykle ciąg rozkazów służący za- 
pamiętaniu w pamięci stanu procesora, czyli adresu powrotu, a jeśli zachodzi taka koniecz- 
ność, to i zawartości jego wszystkich rejestrów. Zakończenie podprogramu przywraca 
adres powrotu i odtwarza stan procesora, tak aby dalsza część programu głównego mogła 
być wykonywana bez zakłóceń. 


Sterowanie wywoływaniem podprogramu i powrotem do programu głównego nazywa 
się przyłączaniem podprogramu (ang. subroutine linkage). Kolejność wykonywania ciągu 
rozkazów jest następująca: sekwencja startowa, początek podprogramu, ciało podprogramu, 
zakończenie podprogramu i sekwencja czyszcząca. 


PRZYKŁAD 


Napisać program obliczania pola kwadratu dla długości boków od 1 do 100 (co 1) odwołu- 
jący się do podprogramu POLE podnoszącego do kwadratu liczbę umieszczoną w rejestrze 
B. Załóżono, że 8-bitowy procesor oprócz licznika rozkazów ma jeszcze 3 rejestry A, B, 
i C. Będziemy posługiwać się mnemonikami rozkazów przedstawionymi w rozdziale 4. 


MOV C,100 Jładuj 100 do rejestru C 
MOV A,1 Jładuj 1 do rejestru A 
MOV BA Jładuj zawartość A do B 
KROK  CALLPOLE  /wywołanie adresu POLE 
STRADR,A /zapis A pod adres ADR 
INC ADR /zwiększenie ADR o 1 
INC B /zwiększenie B o 1 
SUB C,B /odjęcie C — B 
JNZ KROK /skok warunkowy wykonywany gdy znacznik Z różny od 0 
HALT /zatrzymanie 


7.1. Wywoływanie podprogramów 14] 


POLE MOV A,B /przepisanie B do A 
MUL A,B /pomnóż A i B, zapisz do A 
RET 


W programie umieszczono dwie wartości stałe: wartość początkową i wartość końcową. 
Można było umieścić inne, jak np.: wartość początkową i krok. Wprowadzenie wartości 
stałych do programu wykonuje się rozkazami w trybie natychmiastowym. Pierwszy rozkaz 
wprowadza do rejestru C wartość końcową 100, a drugi do akumulatora A wartość po- 
czątkową 1. Założono dalej, że wyniki wszystkich operacji bloku ALU są przesyłane do 
rejestru akumulatora. Dlatego trzeci rozkaz, który jest przepisaniem zawartości rejestru A 
do B, umieszczono celem zwolnienia rejestru A. Rozkaz ten stanowi sekwencję startową 
wywołania podprogramu. Jest on jednobajtowym rozkazem w trybie rejestrowym, przy 
założeniu, że numery (adresy) źródła i przeznaczenia zmieszczą się w bajcie kodu operacji. 


Mov C 
100 
MOV A 


MOV B,A 
CALL 
ADR CALL 
ADR CALL 
STR 
ADR STA 
ADR STA 
INC ADR 
INC B 
SUB C,B 
JNZ 
ADR JN 
ADR JNZ 
HALT 
MOV A,B 
MUL A,B 
RET 


ADR CALL = 18 


O SOM BOND ŁR O 


Ha 
N 


ADR STA = X 


ADR JNZ =5 


Rysunek 7.1. Mapa pamięci przykładowego programu i podprogramu 


Na rysunku 7.1 pokazano mapę pamięci z umieszczonym programem. Z mapy tej 
wynika, że pierwsze 3 rozkazy zajmują 5 komórek pamięci. Należy zwrócić uwagę na 
numerację komórek rozpoczynającą się od 0. Wywołanie podprogramu, czyli rozkaz 
CALL jest umieszczony pod adresem 5, natomiast w komórkach 6 i 7 znajduje się adres 
podprogramu. Przy pisaniu programu posłużono się adresem symbolicznym podprogramu 
POLE (w następnym podrozdziale opisano jak translatory zamieniają adresy symboliczne 
na adresy rzeczywiste), któremu odpowiada adres rzeczywisty 18. Dlatego, jak to wynika 
z mapy pamięci pokazanej na rysunku 7.1, translator powinien umieścić wartość 18 w ko- 
mórkach 6 i 7. 


Następny rozkaz STR jest wykonywany po powrocie z podprogramu i jest to rozkaz 
zapamiętania wyniku. Użyto rozkazu STR w bezpośrednim trybie adresowania. Adres ten 
programista umieszcza w kodzie programu (2 bajty za kodem operacyjnym rozkazu STR) 
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wybierając tym samym miejsce w pamięci, gdzie znajdzie się wynik programu. Ponieważ 
następny rozkaz zwiększa ten adres o 1, to wynikiem działania programu będzie zbiór 
(wektor) w pamięci, którego początek znajdzie się w komórce, której adres programista 
umieści w bajcie 9 i 10 programu. Po inkrementacji adresu wektora następuje 
inkrementacja zawartości rejestru B, czyli przejście do następnego kroku. Rozkazy STR 
oraz oba rozkazy inkrementacji stanowią sekwencję czyszczącą. Rozkazy tworzące pętlę 
programową, to rozkaz SUB i JNZ. W programie użyto rozkazu SUB dla porównania 
zawartości rejestrów C i B, czyli określenia czy dokonano już 100 kroków, czy też nie. 
Można wykorzystać także rozkaz porównania CMP, który odejmuje dwa argumenty nie 
przesyłając nigdzie wyniku. Ponieważ założono, że blok ALU przesyła wyniki do rejestru 
akumulatora, to po wykonaniu tego rozkazu akumulator zawiera wartość C — B, natomiast 
rejestr znaczników na pozycji znacznika zera Z został ustawiony w zależności od aktu- 
alnego numeru kroku. Dla początkowych kroków Z + 0 (różnica w akumulatorze nie jest 
równa 0) i wykonywać się będzie rozkaz warunkowy JNZ (ang. jump non zero). Dopiero 
w setnym kroku Z stanie się równe 1 i skok nie wykona się, a program przejdzie do 
rozkazu HALT i procesor zostanie zatrzymany. 


Podprogram umieszczono bezpośrednio za programem, choć zwykle umieszcza się go 
w innych miejscach. Początkiem podprogramu POLE jest rozkaz MOV, którego zadaniem 
jest zapewnienie właściwych danych do obliczeń. Ponieważ ostatnim rozkazem programu 
jest rozkaz SUB, to po jego zakończeniu w rejestrze akumulatora znajduje się różnica 
C — B. Wartość ta zostanie stracona, na początku bowiem podprogramu wpisuje się tam 
zawartość rejestru B. Po rozkazie MOV wykonywane jest ciało podprogramu, tj. rozkaz 
mnożenia MUL. Jest to rozkaz jednobajtowy, gdyż nadal obowiązuje założenie, że numery 
rejestrów z argumentami operacji znajdują się w samym kodzie rozkazu, a wynik jest 
przesyłany do akumulatora. Zakończenie podprogramu stanowi rozkaz RET, który w na- 
szym przykładzie jest jednobajtowy. 


Z sekwencji programu nie wynika, dlaczego rozkaz RET wymusi powrót do komórki 
8 pamięci, czyli do właściwego miejsca programu głównego. Dzieje się tak dlatego, że 
w czasie wykonywania rozkazu CALL wykonywał się skok do komórki 18 i jednocześnie 
aktualna wartość licznika rozkazów po inkrementacji (8 — adres następnego rozkazu) 
została zapamiętana (np. przesłana na stos). Rozkaz RET korzysta z zapamiętanego adresu 
jako adresu skoku do programu głównego, tj. do komórki 8 pamięci. Rozkaz RET jest 
wielocyklowy. Jeżeli procesor jest wyposażony w rejestr wskaźnika stosu, to pierwszy 
cykl jest cyklem pobrania kodu operacyjnego, następne cykle są cyklami odczytania 
zawartości wierzchołka stosu (jeżeli adres jest krótki to w szczególności może to być 
jeden cykl) celem załadowania licznika rozkazów i dopiero następny cykl jest cyklem 
pobrania następnego rozkazu (w naszym przykładzie rozkazu STA). Jeżeli natomiast 
procesor nie jest wyposażony we wskaźnik stosu, to cały opisany mechanizm należy 
zorganizować programowo. 


Opisany program jest przykładem uproszczonym i nie pokazuje dwóch ważnych 
mechanizmów: zagnieżdżania podprogramów i ich alokacji. Zagnieżdżanie podprogra- 
mów jest to wywoływanie podprogramów przez inne podprogramy. Stos jest mechanizmem 
stwarzającym możliwość zagnieżdżania, jeżeli każde wywołanie pociągać będzie 
zapamiętanie stanu procesora na stosie. 
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W poprzednim przykładzie na stos zapisywana była tylko zawartość licznika rozkazów, 
ponieważ podprogram nie naruszał zawartości rejestrów w taki sposób, aby program 
w pętli działał błędnie. Aby jednak zapewnić procesorowi możliwość korzystania ze 
wszystkich zasobów komputera (w szczególności rejestrów procesora) w czasie wykony- 
wania podprogramu, trzeba zapamiętywać zawartości wszystkich jego rejestrów. W tym 
celu początki podprogramów zawierają zwykle sekwencję rozkazów PUSH przesyłającą 
na stos zawartości rejestrów. Zakończenie podprogramów jest wtedy sekwencją rozkazów 
POP przywracającą rejestrom ich poprzednie zawartości. 


Z powyższego opisu wynika, że w ogólnym przypadku wywołanie podprogramu, czyli 
sekwencja startowa programu głównego, ma za zadanie przekazanie parametrów 
(ang. parameter passing) dla podprogramu, który na zakończenie swego działania przeka- 
zuje wyniki do programu głównego. Istnieją podprogramy, które z racji swego działania 
zmieniają wartości przekazanych im parametrów. Takie parametry podprogramów 
nazywane są parametrami zmiennymi, w odróżnieniu od parametrów stałych niezmienia- 
nych przez podprogramy. Jeśli stosuje się podprogramy z parametrami stałymi, to program 
może przekazywać je podprogramowi poprzez rejestry procesora. Mówimy wówczas, że 
przekazanie parametrów nastąpiło przez wartość (ang. pass-by-value). Jeśli zaś stosuje się 
podprogramy z parametrami zmiennymi, to program może przekazywać je podprogramowi 
poprzez wskazanie w rejestrach procesora ich adresu. Mówi się wówczas, że przekazanie 
parametrów nastąpiło przez nazwę (ang. pass-by-reference). 


Przekazanie parametrów przez wartość ma tę wadę, że argumenty podprogramu nie 
mogą być zbyt długie, podczas gdy przekazanie parametrów przez nazwę umożliwia 
praktycznie dowolną długość argumentów. W tym przypadku w pamięci rezerwuje się 
odpowiednią liczbę komórek, tworzących blok, który podczas przekazywania parametrów 
do podprogramu jest zapisywany przez program główny, a odczytywany przez podprogram. 
W czasie przekazywania wyników podprogram zapisuje blok a program główny go odczy- 
tuje. Istnieje problem umieszczenia w pamięci i zaadresowania tego bloku. Problem ten 
zwie się alokacją (ang. allocation). Blok parametrów umieszcza się w spójnym obszarze 
pamięci. Adres pierwszej komórki pamięci jest adresem bazowym bloku, a każdy parametr 
zajmuje jedną lub więcej komórek pamięci o określonym przesunięciu (ang. offset) 
względem adresu bazowego. 


Jeśli adres bloku parametrów jest związany z programem i alokowany przy każdo- 
razowym wywołaniu podprogramu, to przy każdorazowym wykonaniu podprogramu może 
on być w innym miejscu. Mówi się wówczas o alokacji dynamicznej, tj. alokacji w czasie 
wykonywania programu. Jeżeli zaś blok jest związany z podprogramem, to jego adres 
bazowy jest ustalany w czasie kompilacji (translacji) programu i jest niezmienny. Dlatego 
program główny musi znać ten adres przed wykonaniem programu. W takim przypadku 


mówi się o alokacji statycznej, tj. alokacji w czasie ładowania programu przez program 
ładujący. 


7.2. PROCES TRANSLACJI 


Sposób programowania, w którym programista stosuje mnemoniczne kody rozkazów 
danego procesora jest nazywany programowaniem na najniższym poziomie (w odróżnieniu 
od języków wysokiego poziomu jak język C, FORTRAN lub PASCAL) lub programo- 
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waniem w języku symbolicznym (języku asemblera). Reguły tworzenia języka dla różnych 
komputerów mają pewne wspólne cechy. Podstawowym elementem takiego programu jest 
wiersz (linia). Każdy wiersz składa się z trzech wydzielonych części zwanych polami: 

— pola etykiety (ang. label field), 

— pola rozkazu (ang. instruction field), 

— pola komentarza (ang. comment field). 


Pole etykiety może być puste lub może zawierać adres symboliczny ułatwiający pisanie 
programu. Adres symboliczny stosuje się w programie w tych miejscach, gdzie programista 
nie jest w stanie określić właściwego adresu. Ma to miejsce najczęściej przy rozkazach 
skoków. Jako adresu symbolicznego używa się zwykle ciągu trzech (lub więcej) znaków 
alfanumerycznych, przy czym zakłada się zwykle, że pierwszy znak jest literą. 


Pole rozkazu wskazuje rodzaj operacji i jej argumenty. W zależności od typu rozkazu 
postać tego pola może być różna. 

l) Jeśli rozkaz jest bezargumentowy, to w danym polu występuje jedynie mnemonik 
tego rozkazu. 

2) Jeśli rozkaz jest jednoargumentowy, to po mnemoniku określającym kod rozkazu 
następuje odstęp (spacja), a następnie wskazywany jest argument. Mogą zajść trzy 
przypadki, w zależności od zastosowanego trybu adresowania: 

— jeśli rozkaz jest w trybie natychmiastowym, to po kodzie rozkazu powinien 
zostać podany argument, 

— jeśli rozkaz jest w trybie rejestrowym lub rejestrowym pośrednim, to po 
kodzie rozkazu powinna zostać podana nazwa (lub numer) rejestru, 

— jeśli rozkaz jest w trybie bezpośrednim, pośrednim lub złożonym, to po 
kodzie rozkazu powinien zostać podany adres argumentu (adres symboliczny). 

3) Jeśli rozkaz jest dwuargumentowy, to po kodzie rozkazu podawane są kolejno 
adresy jego argumentów. Na przykład, dla rozkazu przesłania, kolejność może 
oznaczać, że jako pierwszy występuje adres źródła, a drugi adres przeznaczenia. 


Pole komentarza programista może wykorzystać do opisu celowości użycia danego roz- 
kazu. Komentarz w danym wierszu jest wpisywany po specjalnym znaku (np. /), który 
służy do poinformowania programu tłumaczącego, że dalsze znaki nie podlegają translacji. 


Poniżej pokazano przykładowy wiersz programu zawierający rozkaz oznaczony 
etykietą ABC. Rozkaz ten jest umieszczony w komórce pamięci o adresie ABC i wykonuje 
przesłanie pomiędzy komórką pamięci o adresie symbolicznym ADR a rejestrem A pro- 
cesora: 


ABC MOV A, ADR /przesłanie zawartości komórki pamięci 
/o adresie [ADR] do rejestru A 


Proces translacji, czyli tłumaczenia ciągu rozkazów napisanych w języku symbolicz- 
nym na binarny kod maszynowy jest wykonywane przez translator, czyli program tłuma- 
czący w tym przypadku zwany asemblerem (ang. assembler). Programista zapisując 
program w języku symbolicznym ma do dyspozycji także pewne rozkazy, sterujące pro- 
cesem asemblacji, zwane pseudorozkazami (ang. pseudocommana). Przykładowe pseudo- 
rozkazy to: 
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1) ORG (ang. origin) — wraz z wyrażeniem umieszczonym za symbolem ORG usta- 
wia wartość licznika rozkazów, a więc przypisuje adres rzeczywisty rozkazowi 
umieszczonemu bezpośrednio za tym pseudorozkazem, np.: 

ORG OFO0F — oznacza, że, przy założeniu 16-bitowego adresu podawanego szes- 
nastkowo, następny rozkaz umieszczono pod adresem 0000 1111 0000 1111. 

2) EQU (ang. equate) — oznacza przypisanie nazwie stojącej po lewej stronie sym- 
bolu wartości wyrażenia stojącego po prawej stronie symbolu, np.: 

POL EQU 10 — oznacza, że nazwie POL przypisuje się wartość 0001 0000 
(szesnastkowo). 


3) END — oznacza koniec programu. 


Proces translacji jest realizowany w trzech krokach: 
1) tłumaczenie wykonywane przez asembler, 
2) łączenie z innymi programami wykonywane przez program łączący (ang. linker), 
3) ładowanie w odpowiednie miejsce pamięci komputera wykonywane przez pro- 
gram ładujący (ang. loader). 


TŁUMACZENIE WYKONYWANE PRZEZ ASEMBLER 


Program napisany w języku symbolicznym tworzy program źródłowy dla programu 
tłumaczącego i jest pamiętany w tzw. pliku źródłowym (ang. source file). Zadaniem pro- 
gramu tłumaczącego jest utworzenie programu wynikowego (ang. object program), 
tj. ciągu rozkazów zapisanych w języku maszynowym (binarnie). Program tłumaczący 
rozpoczyna swoje działanie od zarezerwowania miejsca w pamięci dla tzw. tablicy symboli 
adresowych oraz ustawienia początkowego adresu programu (adresu bazowego) w liczniku 
adresów. Tablica symboli jest zapełniana nazwami etykiet napotykanych przez program 
tłumaczący w miarę odczytywania linii programu źródłowego i każdej etykiecie jest 
przypisywana liczba będąca odpowiednim adresem względnym (względem adresu zade- 
klarowanego jako bazowy pseudorozkazem ORG). Jeżeli odczytany wiersz zawiera rozkaz, 
to asembler zapisuje do zbioru wynikowego odpowiednie słowo kodu maszynowego oraz 
zwiększa zawartość licznika adresów. Jeżeli wiersz zawiera pseudorozkaz, to jest on 
odpowiednio interpretowany i wykonywany. Jeżeli odczytany wiersz zawiera etykietę, to 
mogą zajść dwa przypadki: pierwszy, gdy nazwa tej etykiety wystąpiła już wcześniej 
(odwołanie wsteczne — ang. backward references), i drugi, gdy w czasie tłumaczenia, 
asembler jeszcze nie napotkał tej nazwy (odwołania do przodu — ang. forward reference). 
W pierwszym przypadku asembler już wcześniej przypisał tej etykiecie pewną wartość. 
W drugim przypadku problem jest trudniejszy. Jest on rozwiązywany poprzez takie 
zaprojektowanie programu tłumaczącego, które polega na dwukrotnym odczytywaniu 
programu czyli na tzw. dwóch jego przebiegach (asemblery dwuprzebiegowe — ang. two- 
-pass assembler). 


Istnieją dwa rodzaje asemblerów dwuprzebiegowych: asemblery z tablicą adresów 
i asemblery z tabelą przypisań (sklejeń). 


Asemblery z tablicą adresów w pierwszym przebiegu tworzą tablicę adresów, w któ- 
rej różnym symbolom adresowym przyporządkowano różne wartości, a w drugim prze- 
biegu przypisywane są adresom symbolicznym programu źródłowego adresy według 
gotowej tablicy adresów. 
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Asemblery z tablicą przypisań już w pierwszym przebiegu tworzą zbiór wynikowy, 
choć rozkazy z odwołaniem do przodu nie mogą zostać w pełni przetłumaczone, gdyż nie 
znane są jeszcze ich adresy. Asembler rezerwuje dostateczną liczbę miejsc w tablicy, która 
jest wypełniana podczas drugiego przebiegu i adresy odwołań do przodu są przypisywane 
właśnie podczas tego przebiegu. 


Jak widać z tego opisu w obu przypadkach tłumaczenie zachodzi w dwóch przebie- 
gach. Różnica polega na tym, że w pierwszym przypadku zachodzi dwukrotny przebieg 
programu źródłowego, a w drugim przypadku drugi przebieg zachodzi już na zbiorze 
wynikowym. 


ŁĄCZENIE Z INNYMI PROGRAMAMI WYKONYWANE PRZEZ PROGRAM ŁĄCZĄCY 


Zadaniem programu łączącego jest scalenie programu napisanego przez programistę 
zprogramami, do których on się odwoływał. Programami tymi są zwykle programy 
biblioteczne, w jakie wyposażono komputer. W wyniku działania programu łączącego 
powstaje zbiór wynikowy (ang. executable file), który jest ciągiem rozkazów gotowym do 
wykonania przez procesor. 


ŁADOWANIE W ODPOWIEDNIE MIEJSCE PAMIĘCI KOMPUTERA WYKONYWANE 
PRZEZ PROGRAM ŁADUJĄCY 


Zbiór wynikowy może być umieszczony w dowolnym miejscu pamięci, ponieważ w wy- 
niku działania programu tłumaczącego adresy poszczególnych rozkazów powstają jako 
adresy względne, tj. przypisane są im adresy liczone względem adresu odniesienia. Dlatego 
programista może umieścić je w pamięci poczynając od adresu przypisanego pseudo- 
rozkazem ORG. W niektórych systemach rola programu ładującego jest większa, gdyż 
musi zostać zapewniona możliwość ładowania programu w różne miejsca pamięci w róż- 
nym czasie. Taka możliwość ta zwana jest relokacją (ang. relocation). 


Tak przetłumaczony program wynikowy jest gotowy do wykonania. Stanowi on ciąg 
rozkazów w kodzie maszynowym, połączony z bibliotecznymi podprogramami 1 umiesz- 
czony w określonym miejscu. Wywołuje się go przez podanie adresu początkowego, który 
jest ładowany do licznika rozkazów 1 pobierany przez procesor do wykonania. 


7.3. SYSTEMY OPERACYJNE 
7.3.1. WPROWADZENIE 


Aby komputer prawidłowo wykonał program trzeba, aby program ten mógł być zredago- 
wany, sprawdzony, zamieniony na kod operacyjny rozkazów komputera i wreszcie, aby 
mógł być uruchomiony, tj. sprawdzony na danych testowych i ewentualnie poprawiony. 
Wszystkie te czynności są na tyle skomplikowane, że nie są one realizowane przez sprzęt 
lecz przez specjalne programy. Zbiór programów, które umożliwiają wykonanie opisanych 
zadań, a także korzystanie z wszelkich zasobów komputera, tj. z procesora (-ów), pamięci, 
urządzeń wejścia-wyjścia oraz z innych programów użytkowych stanowi tzw. system 
operacyjny (ang. operating system). 


Ważnym zadaniem systemu operacyjnego jest zorganizowanie i optymalizacja dostępu 
do urządzeń zewnętrznych oraz efektywne wykorzystanie pamięci. System operacyjny 
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musi określić kiedy i w jaki sposób urządzenie zewnętrzne może zostać wykorzystane 
przez dany program, w którym miejscu pamięci ma znaleźć się program użytkowy, a gdzie 
dane dla niego i jak przydzielać adresy różnym programom. Zadania i funkcje systemu 
operacyjnego ulegały zmianie w zależności od stosowanego rodzaju przetwarzania. W star- 
szych typach komputerów wykorzystywano tzw. przetwarzanie wsadowe (ang. batch 
processing). Polegało ono na tym, że użytkownik przygotowywał program i dane do niego 
na odpowiednim nośniku tak, aby można było te informacje załadować do komputera bez 
udziału użytkownika (przez operatorów), a po przetworzeniu dostarczyć mu wydrukowa- 
ne wyniki. We współczesnych komputerach stosuje się przetwarzanie interakcyjne 
(ang. interactive processing), polegające na ustawicznej ingerencji użytkownika w proces 
przetwarzania na wszystkich jego etapach. W takim przypadku system operacyjny jest 
wykorzystywany przez użytkownika i dlatego projektanci systemów operacyjnych dążą do 
tego, aby był on przyjazny (ang. friendly) użytkownikowi. Określenie to przyznano tym 
systemom operacyjnym, które ułatwiają użytkownikowi korzystanie z komputera ipo- 
magają mu w rozstrzyganiu napotkanych problemów. 


Komputery podzielić można na komputery przeznaczone dla jednego użytkownika 
(ang. single user) i dla wielu użytkowników (ang. multi-user). W pierwszym przypadku 
komputer wykonuje zwykle jeden program, a w drugim wykonują się jednocześnie 
programy wielu użytkowników. Zadania systemu operacyjnego są znacznie bardziej 
złożone w tym drugim przypadku, gdzie musi on zapewnić wieloprogramowość 
(ang. multiprogramming). Jednym ze sposobów realizacji takich systemów jest przydział 
czasu na wykonywanie poszczególnych programów i takie systemy są nazywane 
systemami z podziałem czasu (ang. time sharing). Zdarza się jednak, że w działanie 
systemu ingerują zdarzenia zewnętrzne (np. stan alarmowy na wyjściu czujnika w sys- 
temach sterowania przemysłowego) i one sterują wykonywaniem poszczególnych pro- 
gramów. Mówi się wówczas, że system jest systemem czasu rzeczywistego (ang. real- 
-time systems). Ponieważ w tych ostatnich systemach dane pochodzą z zewnątrz, to 
ważnym parametrem jest czas reakcji komputera na dane zdarzenie zewnętrzne. Często 
jest to reakcja na zgłoszone przerwanie, a więc czas jego obsługi. Aby czas reakcji był 
krótki, wymagana jest duża szybkość pracy komputera. 


Współpraca użytkownika z komputerem organizowana jest, na poziomie systemu 
operacyjnego, za pomocą tzw. systemu plików (ang. file). System operacyjny umożliwia 
programiście posługiwanie się plikiem, tj. ciągiem znaków opisanym nazwą. Nazwa jest 
wybierana przez użytkownika, który może plik utworzyć, przepisać w inne miejsce 
pamięci, chronić przed przypadkowym zapisem, wywoływać, łączyć itp. W plikach tych 
użytkownik umieszcza programy i dane. Aby użytkownikowi ułatwić posługiwanie się 
plikami, system operacyjny zawiera programy pomocnicze (ang. utilities). Przy tworzeniu 
plików pomocne są programy zwane edytorami (ang. editor). Edytory są programami 
bardzo przydatnymi operatorowi zwłaszcza podczas pisania programów w języku wysokie- 
go poziomu, gdyż ułatwiają przygotowanie ich do translacji. Translatory języków 
wysokiego poziomu można podzielić na interpretery (tłumaczące program instrukcja po 
instrukcji), gdzie program wykonuje się w czasie translacji i kompilatory (tłumaczące 
cały program), które przygotowują program wynikowy do wykonania. Podczas 
poprawiania programu bardzo przydatnym narzędziem jest program wspomagający 
uruchamianie (ang. debugger). Wszystkie wymienione programy są częścią systemu 
operacyjnego. 
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Jeden z możliwych podziałów systemów operacyjnych jest przedstawiony w tablicy 
7.1. Systemy jednozadaniowe to tzw. systemy dedykowane (np. komputery osobiste czy 
stacje robocze), a systemy wielozadaniowe to systemy z podziałem czasu, w których 
jednocześnie pracuje wielu użytkowników. W takich komputerach system operacyjny 
wyznacza czas dla każdego z użytkowników i stąd nazwa systemów. 


W jednozadaniowych systemach (wykonywany jest jeden program) wsadowych 
system operacyjny, zwany monitorem, nie zezwala na bezpośredni dostęp użytkownika do 
komputera. Programy i dane przygotowywane są na nośnikach magnetycznych, które 
następnie są wprowadzane przez operatora i wczytywane przez system. Do użytkownika 


Tablica 7.1. Podział systemów komputerowych 


systemy wsadowe interakcyjne 
jednozadaniowe wycofane z użytku systemy dedykowane 
wielozadaniowe przetwarzanie wsadowe systemy z podziałem czasu 


przekazywane są wydruki, na podstawie których może on dokonywać ewentualnych 
poprawek. Obecnie nie stosuje się takich systemów. Wielozadaniowe systemy wsadowe 
jednocześnie mogą obsługiwać wiele programów. Programy te zajmują czas procesora 
naprzemiennie. Oznacza to, że gdy procesor czeka na operację wejścia-wyjścia jednego 
programu, to rozpoczyna się wykonywanie drugiego programu. Sterowaniem takiego 
przełączania zadań zajmuje się część systemu operacyjnego zwana programem szeregu- 
jącym zadania (ang. scheduler). Aby ułatwić to zadanie system operacyjny zajmuje się 
także gospodarką zajętości pamięci. Ponieważ większa część programów i danych znajduje 
się w pamięci dyskowej, to sposób optymalizacji czasu dostępu do tej pamięci, czyli 
sposób wymiany informacji pomiędzy pamięcią operacyjną i pamięcią dyskową staje się 
bardzo istotnym problemem. W systemie operacyjnym zadanie to jest nazywane 
zarządzaniem pamięcią (ang. memory management). Systemy komputerowe, w których 
operatorowi przyznaje się aktywną rolę, nazywane są komputerami interakcyjnymi. 
W takich systemach operator decyduje o każdej akcji komputera. 


Z wielu zadań systemu operacyjnego poniżej wyróżniono dwa, które mają największy 
wpływ na architekturę systemu: 
l) szeregowanie zadań (przygotowanie programów, ich wykonywanie, przydzielanie 
zbiorów danych, wykonywanie operacji wejścia-wyjścia itp.), 
2) zarządzanie pamięcią. 


W dwóch następnych podrozdziałach omówiono te zagadnienia. 


7.3.2. SZEREGOWANIE ZADAŃ 


Szeregowanie zadań w systemach komputerowych odbywa się na trzech poziomach: 


1) szeregowanie wysokiego poziomu (ang. high-level scheduling), tj. podejmowanie 
decyzji czy dane zadanie (program) ma zostać dołączone do kolejki do wykonania, 

2) szeregowanie krótkoterminowe (ang. short-term scheduling), tj. podejmowanie 
decyzji o zleceniu procesorowi wykonania danego zadania, 
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3) szeregowanie zleceń wejścia-wyjścia (ang. 1/O scheduling), tj. podejmowanie de- 
cyzji o kolejności programów żądających dostępu do urządzeń wejścia-wyjścia. 


Celem wyjaśnienia opisanych przypadków wprowadźmy trzy pojęcia, które będą pomocne 
w trakcie dalszego opisu: zadanie (ang. job), proces (ang. process) i stan (ang. state). 
Zadaniem nazywa się skompilowany program, połączony już z programami biblio- 
tecznymi oraz plikami, które są przez ten program wywoływane, a więc jest to program 
całkowicie przygotowany do wykonania. Proces jest to zadanie, którym aktualnie zajmuje 
się komputer i które w każdej chwili przyjmuje jakiś stan. Procesy mogą znajdować się 
w jednym z pięciu stanów: 

— stan nowy (ang. new), 

— stan gotowości (ang. ready), 

— stan wykonywania (ang. running), 

—- stan oczekiwania (ang. waiting), 

— stan zatrzymania (ang. halted). 


Proces jest wprowadzany w stan nowy poprzez szeregowanie wysokiego poziomu. Liczba 
procesów ustawianych w stan nowy zależy od tzw. stopnia wieloprogramowości, tj. liczby 
programów, które jednocześnie mogą znajdować się w pamięci operacyjnej. Stan gotowości 
procesu powstaje w wyniku działania szeregowania krótkoterminowego i jest to stan, 
w którym zadanie czeka na wolny czas procesora. Szeregowanie krótkoterminowe dokony- 
wane jest przez program zwany egzekutorem (ang. dispatcher). Ze stanu gotowości 
procesy przechodzą w stan wykonywania w takiej kolejności, w jakiej uszeregowano je 
w stanie gotowości. Stan wykonywania jest to stan, w którym procesor wykonuje dane 
zadanie. Ze stanu wykonywania procesy mogą zostać wprowadzone w stan oczekiwania 
w przypadku, gdy pojawiają się operacje wejścia-wyjścia i następuje szeregowanie zleceń 
wejścia-wyjścia. W stan zatrzymania proces wchodzi po wykonaniu programu przez pro- 
cesor i gdy system operacyjny likwiduje dany proces. Na rysunku 7.2 pokazano diagram 
przejść procesów ze stanu do stanu. 


Oczekiwanie 


Rysunek 7.2. Diagram przejść procesów ze stanu do stanu 


Aby ułatwić proces szeregowania zadań system operacyjny tworzy dla każdego procesu 
tzw. blok sterujący (ang. process control block), który zawiera następujące informacje: 

— identyfikator procesu (ang. identifier), 

— znacznik stanu (ang. state flag), 

— wskaźnik priorytetu (ang. priority level), 

— licznik rozkazów (ang. program counter), 

— wskaźnik pamięci (ang. memory pointers), 
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— stan procesora (ang. context data), 
— stan zleceń operacji wejścia-wyjścia (ang. I/O status information), 
— licznik czasu pracy (ang. accounting information). 


Identyfikator procesu służy do wygodnego manipulowania informacjami o procesie. Znacz- 
nik stanu wskazuje na stan w jakim znajduje się proces. Wskaźnik priorytetu określa 
hierarchię ważności procesu. Licznik rozkazów służy do przechowywania adresu początko- 
wego danego programu, wskaźnik pamięci do przechowywania adresu końcowego, znacz- 
nik stanu procesora do przechowania danych początkowych programu, zawartości rejestrów 
itp., a stan zleceń operacji wejścia-wyjścia przechowuje wykaz urządzeń zewnętrznych 
potrzebnych do wykonania danego programu. Licznik czasu pracy przechowuje tzw. 
ograniczniki czasowe danego programu. Są to wartości liczbowe określające czas, w ciągu 
którego program może przebywać w stanie wykonywania. Jeśli czas ten przekroczono, to 
system operacyjny sam spowoduje przejście tego programu w stan zatrzymania. 


Proces A Proces A Proces A 
Wykonywany Oczekiwany Oczekiwany 


Proces B Proces B Proces B 
Gotowy Gotowy Gotowy 


Proces C Proces C Proces C 
Gotowy Gotowy Wykonywany 


Rysunek 7.3. Kolejność działania programu pod systemem operacyjnym SO 


Dalej będzie rozpatrzony przykład, w którym założono, że w pamięci komputera 
znajdują się trzy programy i jądro systemu operacyjnego (ang. nucleus) nazwane SO 
(rys. 7.3). Założono także, że wykonywany jest program A, a programy B i C są w stanie 
gotowości (rys. 7.3a). Jaką akcję podejmuje procesor, kiedy w czasie wykonywania pro- 
gramu A wystąpi sytuacja wyjątkowa (przerwanie), która wprowadza program A w stan 
oczekiwania? Powstanie sytuacji wyjątkowej powoduje, że procesor rozpoczyna wykony- 
wanie programu należącego do jądra systemu operacyjnego (rys. 7.2b). Program ten decy- 
duje o sposobie reakcji na zgłoszone przerwanie oraz o dalszej akcji procesora, tj. o przejś- 
ciu któregoś z pozostałych programów w stan wykonywania. Niech do wykonywania 
wybrano program C. Powstaje sytuacja przedstawiona na rysunku 7.2c. Program A znajduje 
się teraz w stanie oczekiwania, program B w stanie gotowości, a program C w stanie 
wykonywania. 


Programy szeregujące ustawiają procesy w trzy kolejki (ang. queue). Program szeregu- 
jący wysokiego poziomu zajmuje się procesami w stanie nowym, program szeregowania 
krótkoterminowego zajmuje się procesami w stanie gotowości i program szeregowania 
zleceń wejścia-wyjścia zajmuje się procesami w stanie oczekiwania. Obsługa kolejek 
może być realizowana według różnych algorytmów. Aby wybrać odpowiedni algorytm 
trzeba dokonać ich porównania stosując pięć następujących kryteriów: 
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— wykorzystanie czasu pracy procesora, 
— przepustowość komputera, 

— czas obsługi procesu, 

— czas oczekiwania, 

— czas odpowiedzi. 


Wykorzystanie czasu pracy procesora jest istotnym parametrem w przypadku, gdy cena 
procesora jest wysoka. Zwykle parametr ten mierzony jest w procentach i wynosi od 40 do 
90 procent. Przepustowość jest parametrem wskazującym na liczbę procesów jaka jest 
wykonywana w jednostce czasu i wskazuje na czasochłonność procesów oczekujących. 
Czas obsługi procesu jest ważnym parametrem z punktu widzenia pojedynczego procesu, 
ponieważ wskazuje na całkowity czas jaki upływa od momentu ustawienia procesu w ko- 
lejkę, aż do momentu zakończenia wykonywania tego procesu. Czas oczekiwania jest 
parametrem wskazującym na to ile czasu upływa od momentu ustawienia procesu 


a 
0) 24 27 30 


O 3 9 16 | 30 | 
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Rysunek 7.4. Działanie algorytmów szeregowania: a) FCFS, b) SJF, c) Round-Robin 


w kolejkę, aż do momentu rozpoczęcia wykonywania tego procesu. Czas odpowiedzi jest 
to czas jaki upływa od momentu ustawienia procesu w kolejkę, aż do ukazania się 
odpowiedzi na wyjściu komputera. Parametr ten odgrywa szczególną rolę w systemach 
interakcyjnych. 


Spośród wielu stosowanych algorytmów tutaj przedstawiono trzy algorytmy szeregowania: 
1) algorytm wyboru najdłużej oczekującego procesu FCFS, 
2) algorytm wyboru najkrócej wykonywanego procesu SJF, 
3) algorytm Round-Robin. 


ALGORYTM FCFS 


Algorytm FCFS (ang. first-come-first-served) polega na wyborze tego procesu, który usta- 
wiono w kolejkę najdawniej. Na rysunku 7.4a pokazano przykładowe trzy procesy 
o różnych czasach trwania mierzonych w umownych jednostkach czasu: są to odpowiednio 
24, 3 i 3 jednostki. Kolejność procesów jest na rysunku 7.4a od lewej do prawej. Średni 
czas wykonania trzech programów wynosi (24 + 27 + 30)/3 = 27. Czas ten ulegnie zmia- 
nie, gdy zmieni się kolejność ustawienia procesów. Załóżmy, że pierwszym będzie proces 2, 
drugim 3 i ostatnim 1. Wówczas średni czas wykonania będzie wynosił (3 + 6 + 30)/3 = 13, 
a więc będzie ponad dwukrotnie mniejszy. Wadą algorytmu FCFS jest to, że średni czas 
wykonania programów jest zmienny w funkcji kolejności procesów. 
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ALGORYTM SJF 


Algorytm SJF (ang. shortest-job-first) ustawia procesy w kolejce według ich czasów 
trwania. Na rysunku 7.4b pokazano ustawienie w kolejce czterech procesów. Jako pierwszy 
wykonano program o najkrótszym czasie trwania, a jako ostatni będzie wykonany program 
o najdłuższym czasie wykonania. Algorytm ten zapewnia minimalny średni czas wykona- 
nia, ale jego wadą jest konieczność znajomości czasów wykonania poszczególnych pro- 
cesów. Dlatego też nie może być stosowany podczas szeregowania krótkoterminowego, 
gdyż w tym przypadku nie można ustalić czasu trwania procesu. 


ALGORYTM ROUND-ROBIN 


Algorytm Round-Robin jest najczęściej stosowanym algorytmem szeregowania. 
Polega on tym, że czas procesora jest podzielony na pewne kwanty. Jeżeli po zakończeniu 
kwantu czasu wykonywanego procesu nie zakończono, to jest on przerwany i ustawiony 
na koniec kolejki, a do wykonania jest pobierany proces następny według algorytmu 
FCFS. Tak samo jest wybierany nowy proces w przypadku, gdy ostatnio wykonywany 
proces zakończono i usunięto z kolejki. Na rysunku 7.4c pokazano kolejność wykonywania 
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Rysunek 7.5. Kolejki procesów do wykonania 


poszczególnych procesów według tego algorytmu, przy założeniu, że kwant czasu wynosi 
4 (proces drugi i trzeci nie zajmują całego kwantu czasu). 


Na rysunku 7.5 pokazano schemat ilustrujący oczekiwanie w kolejkach przez procesy. 
Każdy przychodzący proces jest ustawiany w kolejkę procesów nowych, które są 
szeregowane przez program wysokiego poziomu. Następnie procesy przechodzą przez 
kolejkę procesów gotowych, która jest ustawiana przez program szeregujący 
krótkoterminowy. Następnie, w zależności od odwołań do urządzeń zewnętrznych, procesy 
są ustawiane w kolejki dla procesów oczekujących na dostęp do różnych urządzeń. 
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7.3.3. ZARZĄDZANIE PAMIĘCIĄ 


Ze względu na ograniczoną pojemność pamięci operacyjnej rezydują w niej tylko te 
programy, które ustawiono w kolejkę programów gotowych i oczekujących. Pozostałe 
programy znajdują się w pamięci dyskowej i są z niej pobierane w miarę potrzeb. 
W pamięci operacyjnej powinien znajdować się co najmniej jeden proces w stanie goto- 
wości. Natomiast może się zdarzyć, że wszystkie programy będą oczekujące, gdyż zmusi 
ich do tego długi czas oczekiwania na urządzenia zewnętrzne. Wtedy powinna zostać 
przygotowana nowa kolejka procesów gotowych i w tym celu trzeba sięgnąć do pamięci 
dyskowej. Efektywność pracy komputera zależy bardzo od sposobu wymiany zawartości 
pamięci operacyjnej i dyskowej. Czynność ta jest nazywana wymianą zawartości 
(ang. swapping). Stosowane są dwie strategie wymiany: jedna tylko pod kontrolą systemu 
operacyjnego i druga pod kontrolą systemu operacyjnego, ale z możliwością ingerencji 
użytkownika. Pierwsza z nich jest realizowana w tzw. pamięci wirtualnej, a druga 
w tzw. segmentacji pamięci. 


PAMIĘĆ WIRTUALNA 

Pojęcie pamięci wirtualnej (pozornej) wprowadzono dla ułatwienia progamiście 
posługiwaniem się dużymi zbiorami. Chodzi o to, aby nie zajmować jego uwagi podziałem 
zbioru na część mieszczącą się w pamięci operacyjnej i na część którą umieszcza się 
w pamięci dyskowej. Podziałem takim zajmuje się sam komputer. 


Celem zwiększenia efektywności wymiany zawartości pamięci operacyjnej i dyskowej 
wprowadza się jeden z dwu sposobów przydziału obszaru pamięci operacyjnej danemu 
procesowi. Pierwszy nazywany jest podziałem pamięci (ang. partitioning), a drugi 
stronicowaniem pamięci (ang. paging). 
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Rysunek 7.6. Podział pamięci: stały (a) i zmienny (b) 


Podział pamięci polega na przydzieleniu każdemu procesowi spójnego obszaru 
pamięci operacyjnej. Stosowany jest podział stały (ang. fixed-size partition) lub podział 
zmienny (ang. variable-size partition). W pierwszym przypadku pamięć operacyjna jest 
podzielona na niezmienne co do pojemności obszary. Na rysunku 7.6a pokazano taki 
podział pamięci. Trzeba zaznaczyć, że poszczególnym procesom przyporządkowuje się 
obszary o stałej wielkości (niezmienne), choć nie są one równe. Wymiana procesów 
pomiędzy pamięcią operacyjną a pamięcią dyskową polega na usuwaniu procesów z pa- 
mięci operacyjnej i zapisywaniu nowych. Nowy proces jest zapisywany do pamięci opera- 
cyjnej w taki sposób, aby zająć jak najmniejszy wolny obszar, który jest pozostawiony po 
procesach odesłanych do pamięci dyskowej. Taki sposób prowadzi jednak zawsze do tego, 
że część pamięci operacyjnej nie będzie wykorzystana. Pod tym względem bardziej 
efektywny jest podział zmienny. 
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Na rysunku 7.6b pokazano zmiany zawartości pamięci operacyjnej przy zmiennym 
podziale pamięci. Na rysunku pokazano mapę pamięci w trzech kolejnych fazach wymiany | 
zawartości procesów. Niech w pamięci operacyjnej znajdują się cztery procesy, które 
zajmują tyle obszaru pamięci, że brak miejsca na piąty proces. Załóżono, że ma nastąpić 
wymiana procesów i z pamięci ma być usunięty proces 3, a w jego miejsce ma być 
wpisany proces 5. Po takiej czynności pozostaje wolny obszar pamięci. Niech następna 
wymiana procesów polega na usunięciu procesu pierwszego i wpisaniu procesu szóstego, 
co ponownie pozostawia wolny obszar. Po pewnym czasie, gdy w pamięci znajdzie się 
zbyt wiele wolnych obszarów, dokonywana jest alokacja procesów. Polega to na takim 
przemieszczeniu procesów, aby znowu pozostał tylko jeden wolny obszar. Procesy zostają 
do siebie „„dosunięte . Program dokonujący alokacji ma za zadanie zmienić adresy bazowe 
procesów, które zostały wyliczone w czasie kompilacji i nadać im nowe wartości. Technika 
podziału pamięci nie jest zbyt efektywna, gdyż albo traci się na pojemności pamięci (duża 
część pamięci operacyjnej jest nie wykorzystana), albo na czasie pracy procesora (podczas 
alokacji programów procesor nie może wykonywać innych operacji). 


[A | 12,15 
B | 10,11,13,14,16 


Rysunek 7.7. Stronicowanie pamięci i tabele stanu procesów A 1 B 


Bardziej efektywną techniką jest technika stronicowania. Technika ta polega na tym, 
że cały obszar pamięci jest dzielony na stosunkowo niewielkie obszary o stałej wielkości, 
tzw. strony. Zwykle wielkość tych obszarów jest kilkakrotnie mniejsza od obszaru pamięci 
zajmowanego przez proces, więc każdy proces zajmuje kilka stron. System operacyjny 
w każdym momencie dysponuje aktualną listą wolnych stron i w czasie, gdy dany proces 
ma zostać zapisany do pamięci, system operacyjny sprawdza czy istnieje wymagana 
liczba wolnych stron. Jeśli tak jest, to załadowuje on dany proces do wolnych stron. 
Ponieważ strony te nie stanowią najczęściej spójnego obszaru pamięci, to system musi 
przechowywać także informacje, które strony są zajmowane przez każdy proces. W tym 


celu tworzona jest dla każdego procesu tzw. tabela stron, tj. lista stron zajmowanych przez 
dany proces. 


Na rysunku 7.7 pokazano fragment pamięci zawierający dwa procesy A 1 B. Tabela 
stron procesu A jest dwuelementowa, a procesu B pięcioelementowa. Adres logiczny 
składa się zawsze z dwóch składników: numeru strony 1 adresu względnego na stronie, 
tzw. przemieszczenia. Na przykład adres B1,17 oznacza komórkę siedemnastą pierwszej 
strony procesu B. Adres ten zamieniono na adres fizyczny 10,17, gdyż pierwsza strona 
procesu B znajduje się w pamięci na stronie 10, co wynika z tabeli stron. Koncepcja 
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stronicowania umożliwiła zaprojektowanie tzw. pamięci wirtualnej. Jest to taka organizacja 
pamięci operacyjnej i pamięci dyskowej, która umożliwia wykonywanie programów, które 
wymagają większego obszaru pamięci niż wynosi pojemność pamięci operacyjnej. Innymi 
słowy programista nie jest ograniczony, przy projektowaniu programów, pojemnością 
pamięci operacyjnej. System operacyjny dzieli każdy proces na strony i część z nich 
umieszcza w pamięci operacyjnej, a część w pamięci dyskowej. Dopuszcza się, że część 
stron danego procesu będzie rezydować w pamięci operacyjnej, a część w pamięci 
dyskowej. Do pamięci operacyjnej są przepisywane tylko te strony, które w danym 
momencie są niezbędne. Jeśli nastąpi odwołanie do komórki pamięci, która w danym 
momencie znajduje się w pamięci dyskowej, to powstaje sytuacja wyjątkowa „błąd strony” 
(ang. page fault) i zainicjowanie programu wymiany strony w pamięci. Rozwiązanie 
problemu wyboru strony do usunięcia z pamięci jest problemem analogicznym do prob- 
lemu wymiany bloku w pamięci kieszeniowej. Pozwala to na stosowanie tych samych 
algorytmów wymiany, które opisano w rozdziale 5. 


SEGMENTACJA 


Omówione sposoby współpracy pamięci operacyjnej i pamięci dyskowej były całkowicie 
podporządkowane systemowi operacyjnemu. Natomiast w systemach komputerowych 
jednoprogramowych, przeznaczonych dla jednego użytkownika, często powstaje problem 
zwiększenia efektywności pracy systemu poprzez stworzenie użytkownikowi możliwości 
decydowania o tym, która część jego programu będzie w pamięci operacyjnej, a która 
w pamięci dyskowej. Możliwość taka powstaje, gdy programista może swój program 
podzielić na segmenty, których adresy bazowe będą przez niego ustalone. Adresy te 
umieszczono w odpowiednich rejestrach procesora. W takim przypadku liczba rejestrów 
decyduje o tym, na ile segmentów można dzielić programy. Segmenty mogą mieć stałą lub 
zmienną wielkość. Na przykład użytkownik może podzielić obszar pamięci na trzy części: 
część dla kodu rozkazowego, część dla danych i część przeznaczoną dla stosu. 


Zalety segmentacji są następujące: 

1) Uproszczenie zarządzania skomplikowanymi strukturami danych. Jeżeli użytkow- 
nik nie potrafi z góry określić potrzebnej pojemności pamięci operacyjnej, to 
pozostawia ten problem systemowi operacyjnemu, który będzie określać potrzebną 
wielkość segmentów. 

2) Możliwość dokonywania zmian i rekompilacji tylko części programu bez koniecz- 
ności przeładowywania, kompilacji i dołączania całego programu. 

3) Możliwość wykonywania różnych programów działających na tych samych da- 
nych 1 możliwość wykonywania tego samego programu na różnych danych. 

4) Ułatwienie ochrony zasobów, gdyż dla każdego programu istnieje dobrze określony 
obszar danych. | 

5) Możliwość jednoczesnego wykorzystania mechanizmu segmentacji i stronicowa- 
nia, czyli wykorzystanie systemu operacyjnego przy jednoczesnym stworzeniu 
programiście możliwości dzielenia programu na segmenty. 


MECHANIZMY PRZYSPIESZAJĄCE 
PRACĘ KOMPUTERÓW 


8.1. KLASYFIKACJA KOMPUTERÓW 


W poprzednich rozdziałach przedstawiono architekturę komputerów opartą na modelu 
von Neumana. Model ten zakłada, że komputer wykonuje program, umieszczony w jego 
pamięci operujący na danych, które także znajdują się w pamięci. Taka koncepcja stała się 
niewystarczająca, gdy użytkownicy zaczęli wymagać coraz większych szybkości działania. 
Zwiększanie szybkości działania osiągano często w wyniku zastosowania nowych techno- 
logii: czy to elektronicznych (technologie układów scalonych), czy mechanicznych (kons- 
trukcje pamięci dyskowych). Ale równie ważną drogą zwiększania szybkości działania 
jest poszukiwanie nowych rozwiązań w architekturze komputerów. 


Jednym z takich rozwiązań jest tzw. technika potokowa (ang. pipelining) omówiona w 
dalszej części rozdziału. Metoda ta polega na tym, że pewne zadanie wykonywane przez 
komputer (np. rozkaz) jest tak zdekomponowane, że poszczególne bloki komputera mogą, 
w tym samym czasie, operować na różnych danych, a więc pracować jednocześnie. 
Przykładowo, w czasie gdy jeden blok wykonuje rozkaz o numerze k, to inny blok w tym 
samym czasie może wyliczać adres argumentu następnego k+1 rozkazu, a jeszcze inny 
wykonywać cykl pobrania k+2 rozkazu. Zwiększenie szybkości pracy komputera można 
uzyskać przez wprowadzenie zwielokrotnienia zarówno ciągu danych jak i instrukcji. 
Oznacza to, że w tym samym czasie różne bloki systemu operują na różnych danych 
i wykonują różne zadania. Takie rozwiązania są stosowane w systemach wieloproceso- 
rowych i równoległych. Opisane obserwacje doprowadziły Flynna w roku 1966 do pewnej 
klasyfikacji komputerów i podziału ich na cztery klasy: 
l) komputery z pojedynczym ciągiem instrukcji (ang. single instruction stream) 
i pojedynczym ciągiem danych (ang. single data stream) — SISD, 
2) komputery z pojedynczym ciągiem instrukcji i z wielokrotnym ciągiem danych 
(ang. multiple data stream) — SIMD, 
3) komputery z wielokrotnym ciągiem instrukcji (ang. multiple instruction stream) 
1 pojedynczym ciągiem danych — MISD, 
4) komputery z wielokrotnym ciągiem instrukcji i wielokrotnym ciągiem da- 
nych — MIMD. 


Klasyfikacja ta (rys. 8.1), choć elegancka, upraszcza stan faktyczny, gdyż np. w rzeczy- 
wistości nie istnieją praktyczne realizacje systemów typu MISD. Natomiast projektowane 
coraz to nowe architektury wymuszają inne kryteria klasyfikacji. 


Inny podział systemów komputerowych zaproponował Treleaven i Lima w roku 1984, 
w którym pojęcie instrukcji zastąpiono pojęciem bloku obliczeniowego. Blokiem oblicze- 
niowym nazwali oni wykonywaną operację wraz z jej argumentami i wynikami. Wykony- 
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Rysunek 8.1. Klasyfikacja Flynna 


wany program można zastąpić ciągiem bloków obliczeniowych, których kolejność i mo- 
menty rozpoczęcia ich wykonywania są sterowane przez tzw. mechanizm sterujący. 
Wyróżnia się cztery rodzaje mechanizmów sterujących: 

l) samosterujące (ang. control driven), gdzie każdy blok obliczeniowy określa jaki 
następny blok ma zostać wykonany, 

2) sterowane argumentami (ang. data driven), gdzie każdy blok obliczeniowy ma 
ściśle wyznaczoną liczbę argumentów, a rozpoczęcie wykonywania bloku oblicze- 
niowego następuje w momencie, gdy stają się one dostępne, 

3) sterowane żądaniami (ang. demand driven), gdzie każdy blok obliczeniowy wyko- 
nuje się tylko wtedy, gdy wyniki tego bloku są potrzebne do wykonania innego 
bloku obliczeniowego, 

4) sterowane wzorcem (ang. pattern driven), gdzie blok obliczeniowy jest wykony- 
wany, gdy pojawi się pewien określony wzorzec generowany przez inny blok 
obliczeniowy. 


Podobnie wprowadzono pojęcie mechanizmu wymiany danych (ang. data mechanism) 
zdefiniowane jako sposób wymiany danych pomiędzy blokami obliczeniowymi. Wprowa- 
dzono dwa takie mechanizmy: 

1) mechanizm wspólnych danych (ang. shared data) zakładający, że dla wszystkich 
bloków obliczeniowych w pamięci komputera znajduje się tylko jeden zbiór 
argumentów, 

2) mechanizm przesłań komunikatów (ang. message passing) zakładający, że każdy 
blok obliczeniowy ma swój własny zbiór argumentów i jeżeli wyniki jakiegoś 
bloku stanowią argumenty dla drugiego bloku, to wyniki te są przesyłane do tego 
bloku jako komunikat. 


Na podstawie opisanych mechanizmów wprowadzono 8 typów modeli obliczeniowych. 
Każdemu mechanizmowi sterującemu można przypisać mechanizm wymiany danych. Na 
rysuneku 8.2 przedstawiono tę klasyfikację. Model typu COSH odpowiada tradycyjnej 
architekturze von Neumana. Model typu COME odzwierciedla system komputerowy, w 
którym zachodzą procesy komunikacyjne (system wielodostępny) polegające na 
przesłaniach komunikatów. Model typu DASH zakłada istnienie w systemie elementów 
wykonujących równocześnie wiele bloków obliczeniowych. Jest to model komputerów z 
równoległym wykonywaniem zadań, ale zadania te korzystają z tej samej pamięci 
(poważnym problemem staje się problem synchronizacji dostępu do zasobów). Komputery 
typu DAME są także komputerami równoległymi, choć operacje wykonywane są 
współbieżnie tylko wtedy, gdy argumenty dla tych operacji są dostępne, a więc gdy 
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Rysunek 8.2. Klasyfikacja Trelcavcna 


przesłano komunikaty. Komputery tego typu zaproponował Ackerman w roku 1982 i na- 
zwano je komputerami o architekturze przepływowej (ang. data flow architecture). 
W modelu typu DESH założono sposób obliczeń opartych na sieci żądań rozpoczynającej 
się od żądania początkowego, a następne żądania są wywoływane w razie potrzeby dostępu 
do odpowiednich argumentów. Podobnie wykonuje obliczenia model typu DEME, choć 
z tą różnicą, że w tym przypadku każdy blok obliczeniowy ma swoją pamięć. Model typu 
PASH wymaga od każdego bloku obliczeniowego, aby był wyposażony w mechanizm 
rozpoznawania wzorca. Wzorzec rozpoczynający proces obliczeń jest porównywany 
z wzorcem przechowywanym w pamięci, a następnie każdy wykonywany blok oblicze- 
niowy generuje wzorzec wywołujący następny blok. Model typu PAME różni się od 
poprzedniego tym, że łatwiejsze są operacje równoległe, gdyż każdy blok obliczeniowy 
wyposażony jest we własną pamięć. 


Rozważania te ilustrują ideę poszukiwań takich architektur, które wykonują program 
w sposób jak najbardziej efektywny. Słowo efektywność można zastąpić słowem szybkość, 
choć będzie to pewne uproszczenie, gdyż nie brane są pod uwagę koszty rozwiązania. Aby 
zwiększyć szybkość wykonywania ciągu operacji, oprócz zastosowania szybszych układów, 
należy zastosować taką architekturę, która umożliwia współbieżność wykonywania 
operacji. Taką współbieżność umożliwiają architektury, które składają się z wielu bloków 
pracujących jednocześnie. Zwiększanie liczby bloków prowadzi oczywiście do zwiększenia 
kosztów. Często zależność ta jest nieliniowa i koszty rosną szybciej. Jedną z przyczyn tego 
jest fakt, że wraz ze złożonością układową trzeba wprowadzać dodatkowe elementy, jak 
na przykład elementy testujące. Wybór architektury jest zatem kompromisem pomiędzy 
szybkością 1 kosztem. 


8.2. PRZYSPIESZANIE WSPÓŁPRACY PROCESORA I PAMIĘCI 
8.2.1. KOLEJKA ROZKAZÓW 


Zwykle podczas wykonywania jednego rozkazu procesor kilkukrotnie żąda dostępu do 
pamięci. Każdy pierwszy cykl maszynowy jest cyklem pobrania rozkazu i zawsze dotyczy 
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Rysunek 8.3. Ciąg operacji przy zastosowaniu kolejki rozkazów 


on pamięci. Następne dostępy do pamięci mogą mieć miejsce wtedy, gdy rozkaz odczytuje 
z pamięci argumenty (tryb bezpośredni) lub ich adresy (tryb pośredni). Załóżmy, że mają 
zostać wykonane kolejno trzy rozkazy, z których pierwszy wymaga pobrania argumentu 
z pamięci i wynik ma zostać przesłany do pamięci, a dla dwóch następnych zarówno 
argumenty, jak i wyniki mają być w rejestrach. Na rysunku 8.3a pokazano sekwencję 
czynności (operacji) wykonywanych przez klasyczny komputer w czasie cyklu instrukcyj- 
nego pierwszego rozkazu. Operacjami tymi są: 

— dostęp do pamięci, 

— dekodowanie rozkazu, 

— obliczanie adresu argumentu, 

— wykonanie rozkazu. 


W każdym momencie wykonywana jest tylko jedna z podanych operacji mimo, że wy- 
konują ją różne bloki procesora. Można zatem tak zorganizować pracę, aby 4 bloki 
wykonujące 4 różne operacje mogły pracować współbieżnie. Otrzymamy wówczas prze- 
bieg, jak na rys. 8.3b, gdzie pokazano jak dostęp do pamięci (pobranie rozkazu lub 
argumentu, albo zapis wyniku) może się nakładać w czasie z dekodowaniem rozkazu, 
obliczaniem adresu i wykonaniem rozkazu. Można zauważyć, że w czasie dekodowania 
pierwszego rozkazu i obliczania adresu argumentu, pobrano już następny rozkaz, który 
jest dekodowany w czasie pobierania argumentu dla rozkazu pierwszego. Kolejne rozkazy 
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pobierane są zatem przed zakończeniem wykonywania rozkazu poprzedniego i są one 
umieszczane w tzw. kolejce. Do zrealizowania kolejki rozkazów wykorzystuje się pamięć 
buforową typu FIFO, której zasada działania polega na tym, że słowa odczytywane są 
w kolejności ich zapisu. Procesor wyposażony jest w pamięć buforową typu FIFO o pojem- 
ności kilku rozkazów, która zwykle zapełniana jest szybciej niż rozkazy są wykonywane. 
Zatem kolejne rozkazy oczekują na dekodowanie i wykonanie. Pewna trudność może 
powstać wtedy, gdy pojawi się rozkaz skoku. Wówczas układ sterowania procesorem musi 
opróżnić zawartość bufora kolejki i rozpocząć jego ładowanie ponownie od nowego 
miejsca, tj. od miejsca wskazanego przez adres skoku. 


8.2.2. PAMIĘĆ Z PRZEPLOTEM 


Ponieważ operacje wykonywane przez procesor są na ogół szybsze niż operacje dostępu 
do pamięci, to konstruktorzy komputerów poszukują metod pozwalających na przyspie- 
szenie współpracy procesora z pamięcią operacyjną. Jedną z nich jest taki podział pamięci 
operacyjnej na banki, aby do danego banku można było rozpocząć dostęp, zanim skończy 


Strob odczytu M1 


Strob odczytu M2 


Strob odczytu M3 


Strob odczytu M4 


Rysunek 8.4. Praca pamięci z przeplotem 
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się cykl dostępu do innego banku. Takie rozwiązanie nazywa się dostępem z przeplotem 
(ang. interleaving). Istotny jest problem adresowania banków, tj. wyboru części, spośród 
n bitów adresu pamięci, przeznaczonej na wskazanie numeru banku. Jeżeli byłyby to 
bardziej znaczące bity adresu, to sąsiednie komórki znajdowałyby się w tym samym 
banku. W tym przypadku, choć łatwiejsze byłoby rozbudowywanie pamięci i zwiększanie 
niezawodności (uszkodzenie jednego modułu powodowałoby wyłączenie tylko określonego 
obszaru pamięci), to jednak, ze względu na lokalność programu, sąsiednie rozkazy wystę- 
powałyby w tym samym banku. Dlatego lepiej, aby banki były adresowane częścią mniej 
znaczących bitów adresu, gdyż kolejne odwołania będą wtedy do różnych banków i w ta- 
kim przypadku dostępy do pamięci będą mogły na siebie nachodzić. 


Na rysunku 8.4 pokazano dwa sposoby dostępu z przeplotem do pamięci podzielonej 
na 4 banki. Sposób pokazany na rysunku 8.4a jest nazywany przeplataniem z równo- 
czesnym dostępem (ang. simultaneous access) i polega na tym, że 4 kolejne komórki 
pamięci znajdujące się w 4 różnych bankach są odczytywane (lub zapisywane) 
jednocześnie tym samym adresem, a zawartości tych komórek są zapisywane do czterech 
buforów. Zawartości buforów są następnie multipleksowane (multiplekser jest dwukierun- 
kowy) pozostałą częścią bitów adresowych (w naszym przykładzie dwoma bitami) tak, 
aby ukazywały się na wyjściu multipleksera w odpowiedniej kolejności. Zatem w ciągu 
jednego cyklu pamięci można otrzymać dostęp do 4 komórek. Uproszczone przebiegi 
czasowe tak zorganizowanej pamięci pokazano na rysunku 8.4c. 


Drugi sposób pokazany na rysunku 8.4b jest nazywany przeplataniem współbieżnym 
(ang. concurreni access). W tym przypadku dostęp do poszczególnych banków odbywa się 
z przesunięciem czasowym. Czas cyklu pamięci podzielono na 4 części i rejestr adresowy 
każdego banku jest ładowany w różnych chwilach rozpoczynając cykl dostępu do danego 
banku. Na magistralę wysyłane są słowa odczytywane z różnych banków co 1/4 cyklu 
dostępu do pamięci (rys. 8.4d). 


6.2.3. ARCHITEKTURA TYPU HARVARD 


Podziału pamięci na moduły można dokonać także w inny sposób niż omówiony w po- 
przednim podrozdziale. Można wydzielić osobno obszar pamięci dla programu (rozkazów) 
i dla danych (argumenty). W takim przypadku procesor można wyposażyć w dwa układy 
współpracy z pamięcią. Do współpracy z pamięcią programu stosuje się jako układ adreso- 
wania licznik rozkazów, a odczytywana zawartość jest traktowana jako kod operacyjny 


Licznik rozkazów Pamięć 
Rejestr rozkazów programu 


Układ adresowania s 
Pamięć 
Blok rejestrów danych 


Rysunek 8.5. Architektura typu Harvard 
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rozkazu i dlatego słowo to jest przesyłane do rejestru rozkazów. Do współpracy z pamięcią 
danych stosuje się specjalny układ obliczania adresu argumentu (w zależności od rodzaju 
rozkazu), a argumenty są odczytywane z pamięci danych i zapisywane do rejestrów 
procesora lub odczytywane z rejestrów i zapisywane do pamięci. Taka organizacja jest 
nazywana architekturą typu Harvard. W tego typu układzie można rozdzielić magistralę 
rozkazów i danych, co umożliwi rozpoczęcie nowego cyklu dostępu do pamięci rozkazów 
zanim nie zakończy się wykonanie poprzedniego rozkazu. 


Na rysunku 8.5 pokazano uproszczony schemat blokowy architektury typu Harvard. 
W niektórych zastosowaniach, zwłaszcza w systemach mikroprocesorowych dedykowa- 
nych specjalnym zastosowaniom, pamięć programu jest pamięcią stałą (typu ROM) 
i w czasie pracy systemu dokonuje się tylko jej odczytów. 


6.3. ARCHITEKTURY POTOKOWE 


6.3.1. ZASADA DZIAŁANIA 


Dwa podstawowe typy architektur, w których uzyskuje się zwiększenia szybkości obliczeń, 
to: architektura potokowa i architektura równoległa. Celem wyjaśnienia różnicy pomiędzy 
nimi załóżmy, że w klasycznym komputerze jeden rozkaz wykonuje się w pięciu cyklach 
maszynowych: 


rozkaz k+2 


Rysunek 8.6. Cykle wykonania instrukcji 
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— pobranie rozkazu, 

— dekodowanie rozkazu, 
— pobranie argumentu, 
— wykonanie rozkazu, 
— zapamiętanie wyniku. 


Załóżmy, że wszystkie cykle są tej samej długości, choć jest to uproszczenie (zwykle drugi 
i czwarty trwają krócej, gdyż nie wymagają dostępu do pamięci). 
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Rysunek 8.7. Porównanic techniki potokowej i równoległej 


Jak pokazano na rysunku 8.6a wynik wykonania każdego rozkazu w klasycznej archi- 
tekturze von Neumana otrzymywany jest co 5 cykli maszynowych. W architekturze 
potokowej zakładamy istnienie wielu (w naszym przykładzie pięciu) bloków działających 
niezależnie i mogących wykonywać współbieżnie różnie operacje danego cyklu. Każdy 
z 5 bloków czeka jednak na wynik uzyskany z innego bloku. W takiej architekturze wynik 
działania rozkazu można otrzymać co jeden cykl maszynowy (por. rys. 8.6b). W architek- 
turze równoległej zakłada się możliwość współbieżnego wykonywania operacji, ale zakłada 
się także dostępność argumentów dla każdego z 5 bloków w każdym cyklu maszynowym. 
Na rysunku 8.6c pokazano, że taka współbieżność pozwala na uzyskanie wyników 5 rozka- 
zów co każde 5 cykli maszynowych. Architektura potokowa polega zatem na rozbudowaniu 
systemu w taki sposób, aby uzyskać możliwość rozpoczęcia nowego rozkazu zanim za- 
kończy się wykonywanie poprzedniego. Architektura równoległa polega zaś na tym, aby 
rozkazy były wykonywane współbieżnie i całkowicie niezależnie, co jest równoznaczne 
z koniecznością zapewnienia dostępu do argumentów poszczególnych operacji. 


Na rysunku 8.7 zilustrowano różnicę pomiędzy obiema technikami. 


6.3.2. ARCHITEKTURY TYPU RISC 


Konstruktorzy klasycznych komputerów dążyli do wyposażenia ich procesorów w 
możliwie uniwersalny zestaw rozkazów, tak aby umożliwiał on optymalizację programów 
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pisanych w języku symbolicznym. Komputery takie nazwano komputerami z rozbudowaną 
listą instrukcji lub typu CISC (ang. complex instruction set computer). Liczba rozkazów 
w takich komputerach sięgała 200 (IBM 370), a nawet 300 (VAX 11) rozkazów. Różnią się 
one formatem i wykorzystywanymi trybami adresowania. Natomiast po przeprowadzeniu 
badań częstości występowania różnych rozkazów i różnych trybów adresowania, okazało 
się, że można wprowadzić pewną ich klasyfikację, np. pod względem częstości ich wy- 
stępowania. Są rozkazy powtarzające się w programach bardzo często, jak np. rozkazy 
przesłań, które stanowią ok. 33% wszystkich występujących rozkazów. Inne rozkazy, jak 
np. skoki (15%), rozkazy arytmetyczne i logiczne (15%), rozkazy porównań (10%) mają 
mniejszą częstotliwość występowania. Można także stwierdzić, że wiele rozkazów wy- 
stępuje w programach jeszcze rzadziej. Są to rozkazy mnożenia, dzielenia, alokacji stosu 
itp. Podobnie pośród trybów adresowania są jedne występujące częściej (rejestrowe 
pośrednie i rejestrowe bezpośrednie) i drugie występujące rzadziej (względne). Z drugiej 
strony, wyróżnić można rozkazy wykonywane w niewielkiej liczbie cykli maszynowych 
(szczególne znaczenie mają rozkazy jednocyklowe), czyli rozkazy trwające krótko. 
Przesłanki te nasunęły myśl budowania szybkich komputerów, które wyposażone byłyby 
w zestaw instrukcji zawierający tylko rozkazy trwające krótko i często powtarzające się 
w programach. Taka filozofia projektantów doprowadziła do powstania komputerów ze 
zredukowaną listą instrukcji typu RISC (ang. reduced instruction set computer). Charakte- 
ryzują się one nie tylko uboższym zestawem rozkazów, ale i rozkazy dobierane są według 
pewnych cech. Lista instrukcji komputerów RISC charakteryzuje się następującymi 
cechami: 

— dostęp do pamięci operacyjnej jest możliwy tylko rozkazami przesłań, 

— operandy wszystkich rozkazów znajdują się tylko w rejestrach procesora, 

— stosowane są tylko rozkazy o stałym formacie (długości), co pozwala przyspieszać 

operację pobierania rozkazów, 
— stosowanie niewielkiej liczby trybów adresowania pozwala uprościć sterowanie 
procesorem. 


Architektura komputerów typu RISC odznacza się także cechami, które odróżniają ją od 
klasycznego rozwiązania von Neumana. Niektóre z nich to: 

1) architektura potokowa umożliwia skrócenie cyklu dostępu do pamięci, ponieważ 
różne bloki procesora jednocześnie wykonują różne zadania, 

2) układ sterowania procesora jest zwykle bardzo prosty, gdyż niewielka liczba 
rozkazów, stały ich format oraz proste tryby adresowania pozwalają na zmniejsze- 
nie pamięci mikroprogramów, 

3) rozdziela się obszary pamięci dla programów i dla danych stosując architekturę 
typu Harvard, 

4) ze względu na odpowiednio dużą liczbę rejestrów procesora stos jest realizowany 
sprzętowo, co przyspiesza wywoływanie i zagnieżdżanie podprogramów. 


Ta ostatnia cecha pozwala na zwiększenie efektywności procesora podczas implementacji 
języków wyższego rzędu. Jak wynika z rozdziału 7 efektywność translacji bardzo zależy 
od realizacji stosu, który jest przeznaczony do pamiętania aktualnych parametrów wywoły- 
wanych procedur i ich zmiennych lokalnych. Przeprowadzono badania wywołań procedur 
w językach wyższego rzędu i badania liczności ich parametrów i zmiennych. Najczęściej 
występujące procedury mają kilka (np. 5) parametrów wejściowych 1 kilka (np. 7) zmien- 
nych lokalnych, do przechowania których potrzeba kilkunastu rejestrów. Zakładając, że 
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poziom zagnieżdżania procedur nie przekroczy kilku (np. 6) warstw, sprzętową realizację 
stosu można wykonać mając ok. 100 rejestrów. Wynika to z faktu, że przy podanych 
założeniach trzeba 6 zestawów zawierających po 17 rejestrów. Liczba zestawów wynikła z 
poziomu zagnieżdżania, natomiast liczba rejestrów w zestawie wynika z tego, iż trzeba 
5 rejestrów dla parametrów wejściowych, 5 rejestrów dla parametrów wyjściowych, tj. dla 
parametrów dla kolejno wywoływanej procedury i 7 rejestrów dla zmiennych lokalnych. 
Tak dużą liczbę rejestrów można zbudować dzięki temu, że układ sterowania procesorów 
typu RISC jest znacznie prostszy od układu sterowania klasycznego komputera (na 
powierzchni układu scalonego zajmuje kilka razy mniej miejsca). Oszczędność uzyskana 
w układzie sterowania pozwala na przeznaczenie tego miejsca na zwiększenie liczby 
rejestrów, tak aby dało się zrealizować stos sprzętowy. 


6.4. SYSTEMY WIELOPROCESOROWE 


8.4.1. STRUKTURY SYSTEMÓW WIELOPROCESOROWYCH 


Jednym z efektywnych sposobów przyspieszenia pracy systemów komputerowych jest 
zastosowanie w nim wielu procesorów, które pracują równolegle. Systemy takie zwane 
systemami wieloprocesorowymi pozwalają na jednoczesne wykonywanie wielu progra- 
mów. Systemy wieloprocesorowe można podzielić na dwie kategorie: 

l) systemy słabo powiązane (ang. loosely coupled systems), 

2) systemy silnie powiązane (ang. tightly coupled systems). 


Systemy słabo powiązane są to systemy, w których poszczególne procesory komunikują 
się ze sobą poprzez urządzenia zewnętrzne, tj. przez specjalne układy transmisji między- 
procesorowej. Ponieważ każdy procesor jest wyposażony we własną pamięć i urządzenia 
zewnętrzne, to stanowi on samodzielny komputer i wykonuje własny program. Takie 
systemy nazywane są także systemami wielokomputerowymi i stosowane są zwykle do 
zadań, gdzie jest duża odległość pomiędzy poszczególnymi procesorami. Systemy takie 
rozpowszechniły się jako tzw. lokalne lub rozległe sieci komputerowe, w których każdy 
element sieci może pracować samodzielnie i nie wymaga zbyt częstej komunikacji z in- 
nymi komputerami. 


Systemy silnie powiązane są to systemy wieloprocesorowe, w których procesory 
komunikują się ze sobą poprzez wspólną magistralę, do której dołączona jest wspólna 
pamięć i wspólne urządzenia zewnętrzne. Systemem takim zarządza specjalny układ 
zwany arbitrem, którego zadaniem jest ustalanie kolejności dostępu do wspólnych zaso- 
bów. Takie systemy budowane są najczęściej w przypadku, gdy procesory pracują blisko 
siebie, np. w jednej kasecie. 


Współpraca procesorów (lub komputerów) w systemie wieloprocesorowym może 


odbywać się na różne sposoby, które charakteryzują się wieloma cechami. Tutaj zajmiemy 
się trzema z nich. Są to: 


— topologia sieci, 
— rodzaj sterowania przesłaniami, 
— strategia sterowania. 


13 — Podstawy budowy i działania komputerów 
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Rysunek 8.8. Topologic połączeń w systemach wielokomputerowych 


Topologia może mieć charakter statyczny lub dynamiczny. Dynamiczny charakter połączeń 
pozwala na możliwość zmiany konfiguracji systemu przez wykonywany program. Ste- 
rowanie przesłaniami może być synchroniczne, ze wspólnym dla całego systemu zegarem, 
lub też przesłania mogą być asynchroniczne. Sterowanie siecią komputerów lub proceso- 
rów może być scentralizowane lub rozproszone. Sterowanie scentralizowane ma miejsce 
wówczas, gdy jeden centralny układ sterujący zarządza wymianą informacji pomiędzy 
elementami sieci. Sterowanie nazywane jest rozproszonym, gdy każdy element sieci jest 
wyposażony w układ będący fragmentem całego układu sterowania i jest odpowiedzialny 
za uaktywnianie połączenia tego elementu z innymi. 


Systemy słabo powiązane (wielokomputerowe) mają zwykle topologię statyczną, prze- 
słania pomiędzy komputerami asynchroniczne, a sterowanie ma charakter rozproszony. 
Ważną cechą takich systemów jest liczba możliwych połączeń (wejść/wyjść) elementów 
sieci. Na rysunku 8.8 pokazano różne struktury połączeń. Najprostsze struktury to kon- 
figuracja liniowa (ang. linear array) oraz konfiguracja pierścieniowa (ang. ring). Obie te 
konfiguracje wymagają tylko dwóch połączeń dla każdego elementu. Konfiguracja typu 
drzewo (ang. tree) oraz sześcian (ang. 3-cube) wymaga trzech połączeń, a konfiguracja 
typu macierzowego (ang. mesh) wymaga czterech połączeń. Najkosztowniejsza jest kon- 
figuracja pełnych połączeń (ang. fully connected), gdzie wymagana liczba połączeń jest 
równa liczbie elementów minus 1. Na rysunku 8.8 pokazano konfigurację pełną dla 5 
elementów, a więc wymagającą czterech połączeń. 


Systemy silnie powiązane (wieloprocesorowe) mają zwykle konfigurację dynamiczną, 
przesłania są synchroniczne, a sterowanie ma charakter scentralizowany. Dynamiczna 
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Rysunek 8.9. Topologie połączeń procesorów w systemach wieloprocesorowych 


struktura połączeń opiera się na trzech podstawowych konfiguracjach pokazanych na 
rysunku 8.9. Najprostsza konfiguracja opiera się na połączeniu procesorów jedną magist- 
ralą. W takim układzie jednocześnie realizowane jest tylko jedno połączenie. Oznacza to, 
że tylko dwa elementy systemu porozumiewają się jednocześnie. Znacznie wydajniejsza, 
ale droższa, jest konfiguracja wielomagistralowa pokazana na rysunku 8.9b. Liczba możli- 
wych jednoczesnych połączeń jest równa liczbie magistral. 


Na rysunku 8.9b pokazano strukturę dwumagistralową, która pozwala na jednoczesne 
przeprowadzenie 2 transmisji. Najkosztowniejsza jest konfiguracja typu cross-bar umożli- 
wiająca realizację takiej liczby jednoczesnych połączeń, która jest równa liczbie proceso- 
rów. Matryca procesorów i pamięci o wymiarach N x M tworzona jest w taki sposób, że 
N procesorów steruje N wierszami tej matrycy, a do M kolumn jest dołączonych M mo- 
dułów pamięci. W każdym wierszu zachodzi tylko jedno połączenie, gdyż jeden procesor 
odwołuje się tylko do jednej pamięci. Natomiast w każdej kolumnie może zachodzić 
N połączeń, gdyż do danej pamięci mogą żądać dostępu nawet wszystkie procesory. 
Dlatego taki system nazywany jest systemem z pamięcią wielobramową (ang. multiport 
memory). 


Najpowszechniej stosowaną konfiguracją jest konfiguracja magistralowa. Oczywiście 
jej wadą jest konieczność dzielenia dostępu do pamięci i urządzeń zewnętrznych pomiędzy 
procesory. Wymaga to zapewnienia mechanizmu sterującego dostępem. Jednym z moż- 
liwych rozwiązań jest wyróżnienie jednego z procesorów i pozostawienie mu decyzji 
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Rysunek 8.10. Wicloprocesorowy system z magistralami lokalnymi 


o dostępie do wspólnej pamięci i wspólnych urządzeń zewnętrznych. Innym rozwiązaniem 
jest zastosowanie specjalnego układ sterowania centralnego zwanego układem arbitrażu. 
Zasada pracy tych układów jest podobna do pracy sterowników obsługujących przerwania. 
To projektant systemu ustala mechanizm priorytetów dostępu i są one przydzielane według 
tych ustaleń. 


W wielu systemach wykorzystuje się zjawisko lokalności programu i wyposaża się 
każdy procesor we własną pamięć, co znacznie zmniejsza częstotliwość odwołań do 
wspólnej pamięci. W takich systemach wyróżnia się wówczas dwa typy magistral: jedną 
magistralę systemową oraz drugą tzw. magistralę lokalną. System taki jest pokazany na 
rysunku 8.10. Pokazane na rysunku dekodery adresu dołączone do magistrali lokalnej 
informują układ arbitra czy procesor żąda dostępu do pamięci własnej, czy do pamięci 
wspólnej. 


8.4.2. OBLICZENIA RÓWNOLEGŁE 


Jednym z najważniejszych warunków przyspieszania obliczeń w układach wieloprocesoro- 
wych jest wykorzystanie algorytmów pozwalających na zrównoleglanie operacji. Algoryt- 
my te opierają się na dekompozycji danego zadania na takie podzadania, które mogą być 
wykonywane równocześnie. W takim przypadku można zlecać różnym procesorom różne 
podzadania tak, aby pracowały one równolegle. Dalej pokażemy przykładowy sposób 
dekompozycji zadania. 


Rozpatrzmy przykład mnożenia dwóch macierzy: 
aoo 301 


aio 411 
a20 42] 


c= B = p0 boi 


10 bin 
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Wynikiem mnożenia jest macierz: 


aQ0boo + Ao1b10  A00bo1 + 201b11 
A= |agbgo + A11b10 41001 + An1b1i 
A29b00 + A21bio a20b01 + 221b11 


Każdy spośród 6 elementów macierzy wynikowej jest obliczany za pomocą operacji 
polegającej na wykonaniu dwóch mnożeń i jednego dodawania. Jeśli te trzy operacje 
uznamy za jeden krok obliczeń, to elementy macierzy wynikowej mogą zostać obliczone 
w 6 krokach. Celem dekompozycji takiego zadania przedstawmy macierz A jako macierz 
(A,, A, A), gdzie A, jest wektorem odpowiadającym 1-temu wierszowi macierzy A oraz 
macierz B jako macierz (B,, B,), gdzie B, jest wektorem odpowiadającym 1-tej kolumnie 
macierzy B. Wynikową macierz C można przedstawić jako macierz (C,, C}, C,), gdzie 

C, = A,B,, A,B, 

C, = A,B,, A,B, 


C, = A,B,, A,B, 


Widać stąd, że każdy wektor C, można obliczyć w jednym kroku mając do dyspozycji 
dwa procesory. Każdy z procesorów obliczać może jeden z elementów wektora. Zatem 


obliczenie macierzy wynikowej można wykonać w 3 krokach (dla każdego wiersza ma- 
cierzy C oddzielnie). 


Zadanie to można zdekomponować także inaczej. Mając do dyspozycji trzy procesory 
można zadanie zdekomponować w taki sposób, aby w jednym kroku obliczać kolumny 
macierzy wynikowej i wówczas zadanie wykonać w dwóch krokach. Natomiast jeżeli 
mamy 6 procesorów, to obliczenia można wykonać w jednym kroku (dla każdego elementu 
macierzy C oddzielnie). Mając 12 procesorów można dokonać obliczenia wszystkich 
elementów macierzy C tak, aby dwa procesory wykonywały operację mnożenia równo- 
legle. Dla dodania wyników mnożeń potrzeba tylko 6 procesorów i w czasie tej operacji 
6 procesorów pozostanie nie wykorzystanych. Przykład ten ilustruje, jak trudny może być 
problem synchronizacji wykonywanych operacji w równoległych systemach kompute- 
rowych. 


Wyróżnia się dwie klasy systemów równoległych: systemy synchroniczne i systemy 
asynchroniczne. W systemach należących do pierwszej klasy poszczególne kroki pracy 
systemu są synchronizowane w taki sposób, że kolejne z nich rozpoczynają się wówczas, 
gdy wszystkie procesory skończą wykonywanie swoich poprzednich zadań. Przebiegi 
czasu pracy poszczególnych procesorów w systemie synchronicznym zilustrowano na 
rysunku 8.11. 


Krok 1 Krok 2 Krok 3 


p1 
p2 [Progam 
pa 


Rysunek 8.11. Synchronizacja pracy w równoległych systemach komputerowych 
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kk wła 


Rysunek 8.12. Systoliczna architektura równoległych systemów komputerowych 


W systemach asynchronicznych nie jest wymagana synchronizacja wszystkich proce- 
sorów i może zajść taka sytuacja, że jedne procesory zaczynają kolejny krok zanim 
zostanie zakończony odpowiedni krok w innych procesorach. 


Systemy synchroniczne wymagają jednoczesności rozpoczynania poszczególnych kro- 
ków dla wszystkich procesorów. Przykładem takich systemów są tzw. komputery systo- 
liczne (ang. systolic machine). Nazwa bierze się z analogii do układu naczyniowego 
człowieka, gdzie rytm pracy jest narzucany przez skurcze serca (ang. systole). Analogia 
dotyczy matrycy systolicznej pokazanej na rysunku 8.12. Każdy węzeł takiej matrycy jest 
wyposażony w dwa wejścia i dwa wyjścia i wykonuje swój własny program. Ponieważ do 
każdego wiersza 1 każdej kolumny matrycy doprowadzono strumień danych, to system 
taki można zakwalifikować do komputerów klasy MIMD. W pierwszym kroku przetwa- 
rzania pracują procesory znajdujące się tylko w pierwszym wierszu i pierwszej kolumnie, 
tylko do nich bowiem dotrą dane. W drugim kroku zaczynają pracę procesory znajdujące 


b11 
bo1 
— 01 800 (Noo) (Nos) 


a11 a10 O 


aœ O 0 (Nao) 


2 


Rysunek 8.13. Mnożenie macierzy w strukturze systolicznej 
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Tablica 8.1. Ilustracja procedury mnożenia dwóch macierzy w systemie systolicznym 


No Na 
Krok We lewe We górne C We lewe We górne C 
1 a, b, aby = z 0 
2 Api b Agobpo Ag, Di0 0 = 0 
3 — — Aby aD 0 0 0 
4 s cz Agd taoi Di0 aho bo: Abo, 
5 sę e Agobqc "Ap, Dio An, b, aobo *a,,b,, 


się w drugim wierszu i w drugiej kolumnie itd. Zmusza to programistów do odpowiedniego 
wprowadzania danych do przetwarzania. 


Na rysunku 8.13 przedstawiono proces wykonania programu mnożenia macierzy 
z wyżej przytoczonego przykładu w strukturze systolicznej. Węzły matrycy wykonują 
operacje c=c+ab (podstaw nową wartość c), gdzie a jest wartością wejścia z lewej 
strony węzła, b jest wartością z wejścia górnego, natomiast c opisuje stan węzła. Każdy 
węzeł odpowiednio powiela na swoich wyjściach wartości wejść z poprzedniego kroku. 
Odpowiedniość polega na tym, że wyjście dolne powiela stan górnego wejścia, a wyjście 
z prawej strony powiela stan lewego wejścia. Po 6 krokach przetwarzania stany na wyjś- 
ciach węzłów są równe wartościom macierzy C. 


W tablicy 8.1 przedstawiono wartości wejść i wyjść dla dwóch przykładowych węzłów, 
które arbitralnie wybrano jako węzły Noo i N;,. 


ago boo 801 b10 ago bo1 a01 b11 


Coo Co1 


Rysunek 8.14. Obliczanie wartości cy, i c, w komputerach ze sterowaniem przepływem danych 


Przykładem równoległego systemu asynchronicznego są tzw. komputery sterowane 
przepływem danych (ang. data flow model). Programy dla takich komputerów są tworzone 
przy zastosowaniu tzw. grafów przepływowych. Grafy te pokazują jak ciągi wartości 
wejściowych są przetwarzane na ciągi wartości wyjściowych. Działanie takich komputerów 
różni się od klasycznych tym, że w komputerach klasycznych program wskazuje na 


kolejność rozkazów, a w komputerach przepływowych program wskazuje na to, jak ma 
zachodzić przesyłanie danych. 


Rysunek 8.14 ilustruje jak można obliczyć wartości elementów macierzy C, z 


przytoczonego przykładu, wykorzystując ten model obliczeń. Na rysunku pokazano jedynie 


przykładowe obliczenie wartości cp, i cy, . 


DODATEK A 


A.1. ALGEBRA BOOLE'A 


Algebra Boole'a jest algebrą z trzema operacjami na dwuwartościowych argumentach, 
które przyjmują wartości: 0 i 1. Rezultaty (wyniki) tych operacji są także dwuwartościowe. 
Te trzy operacje, to: 

— suma logiczna (suma boolowska, alternatywa), 

— iloczyn logiczny (iloczyn boolowski, koniunkcja), 

— negacja (inwersja). 


Pierwsze dwa działania są dwuargumentowe (lub mogą mieć więcej argumentów), nato- 
miast trzecie działanie jest jednoargumentowe. Działania te spełniają następujące 
aksjomaty: | 


1) przemienność A:B=B'A, A+B=B+A, 
2) łączność (A:B):C=A:(B:'C), (A+B)+C=A+(B+C), 
3) rozdzielczość A(B+C)=A:B+A'C, (A+B)(A+C)=A+BC, 
4) tożsamość A:0=0, A+0=A, 

A:1=A, A+1=1, 

A:A=A, A+A=A, 
5) komplementarność A:A=0, A+A=1L, 


oraz dwa tzw. prawa de Morgana: 

A+B=A'B, A-B=A+B. 
Operacja sumy logicznej jest zdefiniowana następująco: jeżeli co najmniej jeden z argu- 
mentów jest równy 1, to wynik jest równy 1. Zatem suma logiczna jest równa 0 tylko dla 
przypadku, gdy wszystkie argumenty są równe 0. 


Operacja iloczynu logicznego jest zdefiniowana następująco: wynik iloczynu jest 
równy 1, wtedy i tylko wtedy, gdy wszystkie argumenty przyjmują wartość 1. 


Operacja negacji jest operacją jednoargumentową i jest zdefiniowana jako zmiana 
wartości argumentu, tj. jeśli argument ma wartość 1, to operacja ta daje w wyniku wartość 
0, a jeśli argument ma wartość 0, to operacja ta daje w wyniku wartość 1. 


Działania te można przedstawić za pomocą tzw. tablicy prawdy (pokazanej 
w tabl. D.1). Liczba wierszy w tablicy prawdy jest równa liczbie możliwych kombinacji 
wartości zmiennych wejściowych, tj. dla n zmiennych wynosi ona 2". Funkcja sumy 
logicznej y=A+B przyjmuje wartość 1 w trzech wierszach tabeli prawdy, a więc dla 
trzech kombinacji zmiennych niezależnych. Można ją zapisać jako sumę logiczną wyrażeń 
odpowiadających tym trzem kombinacjom. Powstaje wówczas następujący zapis: 
y=A:B+A:B+A:-B 
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Tablica D.1. Tabela prawdy dla dwóch zmiennych 


A B A'B A+B A B 
0 0 0 0 l 1 
10 0 1 0 1 
0 1 0 l 1 0 
1 1 1 l 0 0 


Ponieważ, z aksjomatu 3 i 4, 
A'B + A-B =(A + A)-B =B oraz A-B + A-B = A(B +B) =A, 


to y=A +B. Wynika stąd, że funkcję boolowską można zapisywać na różne sposoby. 
Będziemy poszukiwać takiego przedstawienia funkcji, które odpowiada najprostszej jej 
realizacji. Pokazane też zostaną kryteria oceny prostoty układu logicznego. 


Trzy wymienione funkcje (suma, iloczyn, negacja) dwóch zmiennych nie wyczerpują 
listy wszystkich możliwych funkcji dwóch zmiennych. Łatwo pokazać, że wszystkich 
funkcji dwóch zmiennych jest 16, gdyż jest ich 2 do potęgi 2”. W tablicy D.2 przedstawio- 


no je wszystkie jako funkcje zmiennych x, i x,. 


f,70 funkcja stała, 

fi = Xg'x, = (X * x.) funkcja NOR, 

f, = Xg'X, funkcja implikacji (zakazu), 

fy = Xg' X, FXX; "X negacja X,, 

= XK; funkcja implikacji (zakazu), 

f.= 0 X; tXo x, = X] negacja x;, 

fs = Xo'X] + Xo'X] funkcja sumy wyłączającej, sumy 
modulo 2 lub funkcja EXOR, 

f, = Xg'X, +Xy'X, FRYX, =X,+X, = (X'X,) funkcja NAND, 

fę = X9'X, funkcja iloczynu, 

[y= XX] FXX, funkcja równoważności, 

sg xy X, "x Ip X; funkcja tożsama ze zmienną, 

Lo X X txo Xio X, FX9 Xj funkcja implikacji, 

foc” Xo'Xı + Xqg' X; Xo | funkcja tożsama ze zmienną, 

a= xy X; az Xo’ X KoT Xi funkcja implikacji, 

ba 26 X, +Xg' X; tXyX,FXFX, funkcja sumy, 

f,s=1 funkcja stała. 


Niektóre z podanych funkcji, jak suma, iloczyn, EXOR, NAND, NOR i funkcja równo- 
ważności, łatwo jest zdefiniować dla większej liczby zmiennych. Funkcję boolowską 
dowolnej liczby zmiennych można przedstawić na różne sposoby. Tu przedstawiono 
4 z nich na przykładzie funkcji trzech zmiennych. Określenie funkcji, to przypisanie odpo- 
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Tablica D.2. Funkcje boolowskie dwóch zmiennych 


fi2 fi} fia fis 


wiednich wartości (0 lub 1) każdej z ośmiu kombinacji zmiennych wejściowych. Te cztery 
sposoby to: 

1) tablica prawdy, 

2) kanoniczna postać funkcji, 

3) dziesiętny zapis funkcji, 

4) mapa Karnaugha. 


Tablicę prawdy pokazano w tab. D.3. Jest to funkcja, która dla pięciu kombinacji zmien- 
nych wejściowych przyjmuje wartość jeden, a dla trzech kombinacji wartość zero. Każdą 
kombinację zmiennych wejściowych można wyróżnić za pomocą jednej z dwóch prostych 
funkcji boolowskich. Pierwsza z nich przyjmuje wartość 1 tylko dła danej kombinacji 
zmiennych wejściowych i druga, która tylko dla tej kombinacji przyjmuje wartość 0. Na 
przykład kombinację zmiennych x,= 1, x,=0 i x,= l można wskazać funkcją 
y= Xy'X,'X,, która przyjmuje wartość 1 tylko dla tej kombinacji, a dla innych — wartość 
0. Funkcję taką nazywa się implikantem lub mintermem. Podobnie, opisywaną kombinację 
zmiennych można wskazać inną funkcją y = Xo +x,+ X,, która przyjmuje wartość 0 tylko 
dla tej kombinacji, a dla wszystkich innych wartość 1. Taką funkcję nazywa się impli- 
centem lub maxtermem. W przykładowej funkcji mamy pięć implikantów i 3 implicenty. 
Funkcję boolowską można przedstawić jako zbiór implikantów, bądź zbiór implicentów. 


Kanoniczna postać funkcji, to algebraiczny zapis sumy logicznej wszystkich impli- 
kantów lub iloczynu logicznego wszystkich implicentów. Można zatem określić dwie 
postacie kanoniczne: 

1) kanoniczną postać alternatywną (dysjunkcyjną), 

2) kanoniczną postać koniunkcyjną. 


Tablica D.3. Tabela prawdy funkcji boolowskiej 


pó 
© 
ta 

La 
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ZZ ZZA ZZ EE 
Przykładową funkcję można zapisać: 
Y = XX 1X3 FXXX; + XXX + XXX + XXX; 
lub 
y = (x, Fx, + x„)(x, + x, + x,)(x Fx, + x,) 

Irzecią postacią przedstawienia funkcji boolowskiej jest dziesiętna postać zbioru 
implikantów lub zbioru implicentów. Najczęściej odpowiednim kombinacjom zmiennych 
przyporządkowuje się liczby dziesiętne i je podaje się jako elementy zbioru. Odpowied- 
niość tę można znaleźć na wiele sposobów, choć najwygodniejszy z nich to taki, który 
bezpośrednio wiąże indeksy zmiennych z wagą pozycji w zapisie binarnym. Kombinacji 
n zmiennych X, ... x„, odpowiada liczba dziesiętna L(x,), gdzie 


nl i 
L(x,) 52x; 2 


a b 
Xo=1 Xo=0 
_Ko_ 
X1=1 X1 X1 
X1= 
X2 
c d 
Xo Xo 
X1 X1 
X3 X3 
X4 
X2 
X1 
X3 
X2 
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Kanonicznej postaci alternatywnej przykładowej funkcji odpowiada w zapisie dziesięt- 
nym zbiór liczb dziesiętnych w postaci: y = Ż(1, 2, 5, 6, 7), gdzie X, nie oznacza sumowa- 
nia arytmetycznego, ale wskazanie na postać alternatywną. Kanonicznej postaci koniunk- 
cyjnej odpowiada zbiór w postaci: y= [[(0,4,3). 


Ostatnim prezentowanym tu sposobem przedstawienia funkcji boolowskiej jest tzw. 
mapa Karnaugha. Jest to zapis graficzny przedstawiający wartości funkcji dla poszcze- 
gólnych kombinacji zmiennych w odpowiednich polach prostokąta. Dla parzystej liczby 
zmiennych prostokąt jest kwadratem. Na rysunku D.1 pokazano mapy dla 2, 3, 4 i 5 zmien- 
nych. Mapa dla dwóch zmiennych (rys. D.la) ma 4 pola. Pozioma kreska nad lewą stroną 
wraz z napisem x, oznacza, że dwóm lewym polom mapy odpowiada wartość PSL 
a dwóm prawym x,=0. Podobnie, dla dwóch górnych pól wartość x,= 1, a dla dwóch 
prawych x,=0. Dla przykładowej funkcji z tabl. D.3 mapa Karnaugha jest prostokątem 
o ośmiu polach i wraz z wartościami funkcji przedstawiono ją na rys. D.lb. 


Zasadą przy tworzeniu map Karnaugha jest, aby sąsiednie pola odpowiadały takim 
kombinacjom zmiennych, które różnią się wartością tylko jednej pozycji. Na przykład 
niektóre sąsiednie kombinacje zmiennych w tabl. D.3 (dwa kolejne wiersze) różnią się na 
więcej niż jednej pozycji. Wiersz drugi (kombinacja 100) i wiersz trzeci (kombinacja 010) 
różnią się na dwóch pozycjach: pozycji odpowiadającej zmiennej x, I zmiennej x,. Tabli- 
cę D.3 tak ułożono, że kolejne wiersze odpowiadają kolejnym liczbom binarnym. 

W tablicy D.4 porównano naturalny kod binarny z kodem Graya. Kodem Graya 


nazywa się taki kod, którego kolejne słowa różnią się tylko na jednej pozycji. Kod Graya 
tworzy się z naturalnego kodu binarnego biorąc: 


> 
En 1 = b,., Pb, 
Sn-2 = b, Bb, l 


gdzie g; to kolejne bity słowa kodu Graya, a b, słowa naturalnego kodu binarnego. 


Tablica D.4. Przyporządkowanie słów kodu Graya słowom naturalnego kodu binarnego 
ai Z AE O ZR R ZAPOZNANIE 
Kod naturalny Kod Graya 


000 000 
100 100 
010 110 
110 010 
00 1 01 1 
10 I 11 1 
0 1 1 10 1 
l 1 I 00 I 


Każdy z czterech podanych sposobów opisu funkcji jest wygodny do stosowania na 
innym etapie projektowania. I tak na przykład tablicę prawdy stosuje się najczęściej we 
wstępnym etapie projektu, gdzie dokonuje się zamiany opisu słownego układu na Opis 
formalny, a mapy Karnaugha podczas minimalizacji układu. 
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Rozważmy funkcję opisaną tablicą prawdy z tabl. D.3. Ta sama funkcja może być także 
opisana przez dwie postacie kanoniczne alternatywną i koniunkcyjną: 


Y = XXX t XXX t X0X1X2 t XXX F XXX 
y = (X9* X, Fx,)(Xx9 Fx, F x„)(X, FX, +X,) 


Z postaci alternatywnej widać, że funkcję tę da się zaimplementować biorąc jedną 
bramkę sumy o pięciu wejściach (dla każdego implikantu po jednym wejściu) i podając na 
jej wejścia wyjścia z pięciu bramek iloczynów. Każdy z tych iloczynów jest trzywejściowy 
1 realizuje jeden z implikantów tej funkcji. Ponieważ w kanonicznej postaci alternatywnej 
tej funkcji wszystkie zmienne występują zarówno w postaci afirmowanej (bez zanego- 
wania) jak i negowane, więc dla realizacji tej funkcji trzeba dodać trzy inwertery. Układ 
logiczny realizujący funkcję z tabl. D.3 pokazano na rys. D.2. 


Rysunek D.2. Realizacja postaci alternatywnej funkcji 


Podobnie można zrealizować kanoniczną postać koniunkcyjną biorąc trzywejściową 
bramkę iloczynu i trzy trzywejściowe bramki sumy oraz trzy inwertery. Układ pokazano 
na rys. D.3. Nie są to jednak jedyne rozwiązania. Zauważmy z map Karnaugha tych 
funkcji, że istnieją tzw. sąsiednie implikanty i sąsiednie implicenty. Rozpatrzmy kolejno 
oba przypadki. 


Sąsiedniość implikantów oznacza, że istnieją dwa implikanty o postaci X'x, i X*x,, 
gdzie X jest iloczynem wszystkich zmiennych oprócz x, (branych w postaci afirmacyjnej 
lub zanegowanych). Stosując prawo pochłaniania otrzymamy, że X'x, + X'x,=X, co 
oznacza, że taką parę implikantów można zastąpić jednym iloczynem X. Dla przykładowej 
funkcji istnieją następujące pary implikantów: 1 i 5, 2 16, 5i 7, 61 7. Do realizacji 


Rysunek D.3. Realizacja postacji koniunkcyjnej funkcji 


178 Dodatek A 


(pokrycia) implikantu o numerze 1 można użyć wyłącznie pary 1, 5. Taka para nazywa się 
implikantem prostym. Do pokrycia implikantu 2 można użyć wyłącznie pary 2, 6, a więc 
drugiego implikantu prostego. Biorąc te dwie pary pokrywamy cztery implikanty. Ostatni, 
piąty implikant (7) można pokryć parą 5, 7 lub 6, 7 i dlatego otrzymamy dwa rozwiązania: 


1) Y1 =X0'X] FXX, FXX 
2) Y2 = XX, FXX, FXX 


Pierwszym kryterium porównania przedstawionych rozwiązań jest liczba bramek. Dla obu 
rozwiązań trzeba jednej 3-wejściowej bramki sumy, trzech 2-wejściowych bramek ilo- 
czynów i dwóch inwerterów. Drugim kryterium jest liczba wejść i ono także nie rozróżnia 
obu rozwiązań. Trzecim kryterium porównania jest kryterium niezawodności działania. 
Polega ono na wykrywaniu tzw. zjawiska hazardu. Zjawisko to wyjaśniono na przykładzie 
realizacji na bramkach iloczynów i sumy pierwszej postaci opisywanej funkcji 
(por. rys. D.4a). Załóżmy, że x,=1 i x,=1 i następuje zmiana wartości zmiennej x, z 1 
na 0. Z mapy Karnaugha wynika, że przy takiej zmianie funkcja zachowuje wartość 1. 
Natomiast ze względu na opóźnienie sygnału wnoszone przez inwerter negujący zmien- 
ną x), na wyjściu inwertera będzie jeszcze 0, gdy na wejściu górnego iloczynu x, już 
przyjmie nową wartość 0. W takim przypadku na wyjściu bramki sumy pojawi się wartość 
0 na czas opóźnienia wnoszonego przez inwerter. Dla drugiej postaci funkcji hazard 
powstaje gdy x,=1l i x,=1 i następuje zmiana wartości zmiennej x,. Należy zauważyć, 
że zjawisko hazardu na mapie Karnaugha można stwierdzić jako przejście pomiędzy 
sąsiednimi polami. Zatem w tym przykładzie uzyskaliśmy dwa rozwiązania, które są 
równoważne dla wszystkich trzech kryteriów. Są to tzw. minimalne rozwiązania dla postaci 
alternatywnej. 


a 
XO XO 
X1 y X1 y 


Rysunek D.4. Dwa równoważne układy realizujące tę samą funkcję 


Poszukajmy teraz minimalnej postaci koniunkcyjnej. Z mapy Karnaugha widać, że 
istnieje tylko jedna para implicentów 0 i 4. Mamy zatem minimalną postać funkcji: 


y = (x, + x,)(% x, + x.) 


Jest to jedyne minimalne rozwiązanie składające się z dwuwejściowej bramki iloczynu, 
jednej dwuwejściowej bramki sumy, jednej trzywejściowej bramki sumy i trzech inwer- 
terów. Układ realizujący taką postać pokazano na rys. D.5. Jest to rozwiązanie zawierające 
mniejszą liczbę bramek w porównaniu z realizacjami postaci koniunkcyjnej. 


Powyższe rozważania dotyczyły postaci boolowskich danej funkcji, a więc rozwiązań 
wykorzystujących bramki sumy, iloczynu i negacji (układy I-LUB-NIE). Mówimy, że te 
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X1 
X2 


Rysunek D.5. Minimalna postać koniunkcyjna 


trzy operacje (a tym samym trzy rodzaje bramek) stanowią system funkcjonalnie pełny, 
tj. taki, że dowolną funkcję można zapisać za pomocą tych trzech operacji. Łatwo można 
wykazać, że istnieją inne zestawy funkcjonalnie pełne. Tu zostaną przedstawione trzy 
z nich: 


1) NAND, 
2) NOR, 
3) 1, I, EXOR. 


Za pomocą funkcji NAND można zrealizować dowolną funkcję boolowską, gdyż trzy 
operacje boolowskie (I, LUB, NIE) dadzą się zrealizować za pomocą funkcji NAND 
(rys. D.6). Warto zauważyć, że funkcja sumy jest realizowana jako funkcja NAND o za- 
negowanych wejściach. Stąd wniosek, że realizując alternatywną postać funkcji za pomocą 
bramek NAND otrzymuje się trzy poziomy bramek, a realizując postać koniunkcyjną 
cztery. 


Rysunek D.6. Równoważność bramek NAND 


Na rysunku D.7 pokazano jak można przekształcić układ logiczny I-LUB-NIE na 
układ logiczny NOR. Zauważmy, że iloczyn logiczny jest realizowany jako bramka NOR 
z zanegowanymi wejściami. W tym przypadku postać alternatywna będzie czteropoziomo- 
wa, a postać koniunkcyjna trzypoziomowa. 


Trzecim zestawem funkcjonalnie pełnym jest przypadek, gdy operacje algebry są 
operacjami: suma modulo 2, iloczyn i stała 1. Taka algebra nazywa się algebrą Reada- 
-Mullera. Dla wykazania pełności funkcjonalnej zestawu trzeba pokazać i w tym 


Rysunek D.7. Równoważność bramek NOR 
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1 


przypadku, że za pomocą wymienionych operacji da się zrealizować operację sumy 1 ne- 
gacji. Te dwie operacje algebry Boole'a przedstawia się według zależności: 
A=10A 
A+B=1Q©AQOBQAB 
Jak z tych zależności widać najbardziej skomplikowana jest zależność sumy logicznej 


w algebrze Reada-Mullera. W niektórych zastosowaniach (testowanie układów logicznych) 
algebra ta jest szeroko wykorzystywana. 


Przekształćmy dla przykładu funkcję sumatora (por. rozdz. 3) 


y; = a,b;c, + a,b;c, + a,b,c, + a,b;c, 


na funkcję w algebrze Reada-Mullera. W tym celu zamieńmy negację zmiennej a na 
operację 1 © a. Otrzymamy, że 


y=a(1©b)(1 © c) +(1©0 a.) b, (1 © c.) + (1 © a.)(1 © b.)c, 
a następnie, że 
y = (a, © ab, D a,c, © a.b.c.) + (b, P b.a. P b.c. © abc.) + (c, D ca, © cb, D a,b,c,) 


Zamieniając operację sumy logicznej a+b na operację 1®a@®b@® ab otrzymamy 
wynik przekształcenia jako 


y; =a ® b, ® c, 


Przykład ten ilustruje jak niekiedy algebra Reada-Mullera jest pomocna przy minimalizacji 
funkcji boolowskiej. 


Xo X1 X2 | Y 

o0o0]ļo 

100ļo 

010|1 X y 
110]0 x2 

001|1 E 

101]1 

01100 

11110 


Rysunek D.8. Realizacja funkcji za pomocą dekodera 


Na zakończenie tego punktu przedstawiono problem wykorzystywania niektórych 
standardowych bloków kombinacyjnych, jak np. dekoderów i multiplekserów. Na 
rysunku D.8 pokazano jak przykładową tabelę prawdy funkcji 3 zmiennych (rys. D.8a) 
można zrealizować za pomocą dekodera o 3 wejściach. Zastosowanie bramki sumy 
logicznej na wyjściu układu nie jest konieczne, gdy wyjścia dekodera są typu otwartego 
kolektora lub trzystanowe. W takim przypadku zwarcie wyjść układu realizuje operację 
logiczną zwaną sumą (iloczynem) montażową lub sumą na drucie (ang. wire-or). 


Na rysunku D.9a pokazano mapę Karnaugha funkcji trzech zmiennych. Biorąc 
multiplekser o trzech wejściach sterujących, a więc o 8 wejściach informacyjnych, podaje 
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OROROORO 
< 


X1 X2 X3 


hepEŹlino 
< 


X1 X2 X3 


Rysunek D.9. Realizacja funkcji za pomocą multipleksera 


się na każde wejście sterujące jedną, arbitralnie wybraną zmienną, a na wejścia infor- 
macyjne stałą 0 lub 1, w zależności od wartości jaką dla danej kombinacji zmiennych 
wejściowych przyjmuje funkcja (rys. D.9b). W tym przypadku założono, że wejścia 
informacyjne są ułożone zgodnie z kodem NKB, przy czym najwyżej położone jest 
wejście odpowiadające kombinacji wejściowej 000. Ponadto założono, że wejście sterujące 
leżące po lewej stronie ma najmniejszą wagę i że wagi rosną w kierunku prawej strony. 


Rozwiązanie nie będzie tak trywialne, gdy zadana będzie funkcja 4 zmiennych i trzeba 
zrealizować ją za pomocą multipleksera o trzech wejściach sterujących. Niech będzie 
dana funkcja jak na rys. D.9c. Wybierając arbitralnie trójkę zmiennych x,x,x, dla wy- 
sterowania wejść sterujących otrzymamy układ jak na rys. D.9d. Jak można zauważyć, 
w tym przypadku na wejściach informacyjnych nie będą stałe logiczne, ale funkcje tej 
zmiennej, której nie wybrano do trójki zmiennych podawanych na wejścia sterujące. Na 
wejścia multipleksera podawane są 0, 1, x, lub X, w zależności od wartości funkcji dla 
danej kombinacji zmiennych. 


A.3. UKŁADY SEKWENCYJNE 


Dla kombinacyjnych układów logicznych stan wyjść układu był funkcją jedynie zmiennych 
wejściowych. Układy takie można opisać algebraicznie trójką: 


A=(XY,A:X>Y) 


gdzie X jest zbiorem stanów jakie przyjmują sygnały wejściowe, Y jest zbiorem stanów 
jakie przyjmują sygnały wyjściowe, a funkcja A opisuje działanie układu, tj. przy- 
porządkowuje stanom wejściowym (wzbudzeniom układu) odpowiadające im stany 


14 — Podstawy budowy i działania komputerów 


162 Dodatek A 


sygnałów wyjściowych. Istnieją jednak układy, dla których stan wyjść zależy nie tylko od 
stanu wejść, ale i od stanu samego układu, zwanego stanem wewnętrznym. Takie układy 
będziemy nazywali układami sekwencyjnym albo automatami sekwencyjnymi. 


Automat sekwencyjny opisuje się piątką: 
A=fXY,S,0:XXSVSA:XXS<*Y), 


gdzie S jest zbiorem stanów wewnętrznych automatu, O jest funkcją przejść automatu, 
czyli funkcją, która określa zmiany stanów automatu wszystkich wzbudzeń, a A jest 
funkcją wyjść automatu, czyli stanom automatu i danym wzbudzeniom przyporządkowuje 
sygnały wyjściowe. Taki automat nosi nazwę automatu Mealy'ego w odróżnieniu od 
automatu Moore'a, dla którego funkcja wyjść A jest określona jako A:S— Y. W tym 
ostatnim przypadku sygnały wyjściowe są uzależnione jedynie od stanów automatu. 
Automaty Moore'a i Mealy'ego są równoważne, jeśli dla każdej sekwencji wzbudzeń 
generują taką samą sekwencję wyjściową. Na ogół automat Moore'a ma więcej stanów niż 
automat Mealy ego. 


Załóżmy dwustanowy {S ,S„} automat o czterech wzbudzeniach X = +X,, X,, X, X3}, 
dwóch stanach sygnałów wyjściowych Y = £Y,, Y,) oraz funkcjach ô i A określonych 
następująco: 


ò: X, XS, =S, A SZA 
X, xS, =S, AZ, 
X xS =S, 
X, X S, =S, 
X xS =S, 
XXS =S] 
X, XS,=S, 
X,X0,705 


Jest to automat sekwencyjny typu Moore'a. Przy projektowaniu automatu wygodnie 
jest zamienić opis algebraiczny na opis graficzny. Jednym z bardzo powszechnie 
stosowanych opisów jest tzw. tablica przejść i wyjść automatu. W tablicy D.5 
przedstawiono tablicę przejść i wyjść zadanego automatu. Tablica przejść ma dwa wiersze 
(dwa stany automatu) i cztery kolumny (cztery różne wzbudzenia). Ponieważ jest to 
automat Moore'a, to tablica wyjść jest jednokolumnowa. Tablica wyjść automatu Mealy ego 
miałaby cztery kolumny. 


Podczas projektowania automatu sekwencyjnego tablicę przejść i wyjść należy 
zakodować binarnie. Przyjmując, że S,=0, S„=1, Y,=1, Y,=0, X,=00, X, = 01, 
X,=10, X,=ll otrzymamy zakodowaną tablicę przejść i wyjść przedstawioną w 
tablicy D.6. Należy zwrócić uwagę, że kolumny tablicy przejść zakodowano w kodzie 


Tablica D.5. Tablica przejść i wyjść automatu 


NI x, L k Xu yY 
Sj 
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Tablica D.6. Zakodowana tablica przejść i wyjść automatu 


Graya. Stany automatu w pierwszej kolumnie (S,) nazywane są stanami pierwotnymi, 
a stany w czterech następnych kolumnach — stanami następnymi S'. Funkcja boolowska 
S'=f (X. S.) określa zależność pomiędzy stanami następnymi i pierwotnymi dla wszyst- 
kich wzbudzeń. Funkcje te wyznacza się bezpośrednio z tabeli przejść. 


Tablica D.7. Tablica prawdy dla funkcji określającej stany następne automatu 


X] X7 S st 
0 0 0 0 
l 0 0 l 
0 l 0 0 
1 l 0 1 
0 0 l l 
l 0 l l 
0 l l 0 
l l l l 


W tablicy D.7 przedstawiono tablicę prawdy funkcji S=f (X. S,) dla naszego 
przykładu. Ponieważ przykładowy automat jest dwustanowy, to wystarczy wyznaczyć 
jedną funkcję S'= f(X, S). 


W przypadku, gdy stany automatu są kodowane na k pozycjach binarnych, należy 
wyznaczyć k różnych funkcji. 


Realizację tego automatu na bramkach I-LUB-NIE pokazano na rys. D.l0a, a na 
bramkach NOR na rys. D.10b. Jak z rysunku widać sekwencyjność układu (właściwość 
pamiętania) realizuje się wprowadzając sprzężenie zwrotne. Taki typ automatów należy do 
klasy automatów asynchronicznych, tj. takich, dla których w momencie zmiany 
wzbudzenia następuje zmiana stanu. Są to automaty o dużej szybkości działania, jednak 
wymagają od projektanta dużej wprawy, gdyż ich poprawne działanie wymaga bardzo 
dokładnej analizy. Dlatego często stosowane są automaty synchroniczne, w których zmiana 
stanu następuje nie w chwili zmiany wzbudzenia układu, ale w chwili określonej przez 
pojawienie się dodatkowego impulsu synchronizującego, czyli tzw. zegara. 


a b c 
X1 S y P w Q 
nws gg 

= 8 q 


Rysunek D.10. Realizacja automatu z tablicy D.7 
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4.0 1 O O 0 1 0 
2 0.0 O 1 0 0 0 


Rysunek D.11. Sekwencja wzbudzenia automatu i sekwencja wyjściowa 


Rozpatrzmy automat opisany wykresem czasowym pokazanym na rys. D.11. Sekwen- 
cję stanów wejściowych i sygnału wyjściowego zapisano binarnie oraz graficznie. Z ry- 
sunku wynika, że pojawienie się I na wejściu x, powoduje, że na wyjściu układu pojawia 
się 0, natomiast pojawienie się 1 na wejściu x, powoduje, że na wyjściu pojawia się 1. 
W przypadku, gdy na obu wejściach pojawią się 1, to na wyjściu będzie 0. Taki dwu- 
stanowy układ nazywany jest przerzutnikiem (ang. flip-flop). Jest to asynchroniczny 
przerzutnik typu wz, gdzie wejście w jest wejściem wzbudzającym stan 1 przerzutnika, 
a wejście z jest wejściem zerującym. W podanym przykładzie wejście x, jest wejściem 
wzbudzającym, a wejście x, jest wejściem zerującym. Jeżeli przerzutnik jet jednocześnie 
wzbudzany i zerowany (w=1 i z= 1), to w tym układzie przewagę ma wejście zerujące 
ina wyjściu będzie y=0. Zauważmy, że dualny do omawianego układ zbudowany na 


bramkach NAND (rys. D.10.c) stanowi układ przerzutnika wz, dla którego jednoczesne 
podanie 0 na oba wejścia powoduje ustawienie stanu 1, więc przewagę ma wejście 
wzbudzające. Aby uniknąć niejednoznaczności działania i aby oba zaznaczone na 
rys. D.10c wyjścia przerzutnika były komplementarne trzeba, aby w + z= 1, tj. aby wejścia 
nie były jednocześnie zerami. Jeżeli na obu wejściach są 0, to po zmianie obu wejść na 1, 
układ przejdzie do stanu, który zależy od różnicy opóźnień na bramkach. Na wyjściu 
bramki o mniejszym czasie propagacji ustali się 0. 
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Rysunek D.12. Synchroniczny przerzutnik typu D 


A 


Aby uniknąć zjawiska hazardu, stosuje się przerzutniki synchroniczne jak pokazany 
na rys. D.12a. Zmiana stanu na wyjściu układu następuje w czasie trwania impulsu 
synchronizującego, a nie w momencie zmiany na wejściach układu (por. rys. D.12c). Ten 


typ przerzutnika jest nazywany przerzutnikiem typu RS od angielskich słów reset 
(zerować) i set (ustawiać stan jeden). 
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Rysunek D.13. Cztery rodzaje przerzutników 


Automaty synchroniczne są budowane z dwóch rodzajów elementów: z bramek 
i z przerzutników. Stosowane są 4 typy przerzutników: 

1) przerzutnik RS, 

2) przerzutniki JK, 

3) przerzutniki D, 

4) przerzutniki T. 


Przerzutnik typu JK działa podobnie jak przerzutnik RS, z tą różnicą, że gdy J=K=l1, to 
sygnał zegarowy zmienia stan przerzutnika. W innych przypadkach wejście J działa jak 
wejście S, a wejście K jak wejście R. Przerzutnik typu D zapamiętuje stan wejścia D 
(ang. data), tj. na jego wyjściu pojawia się taki stan, jaki był na wejściu D w chwili 
impulsu zegarowego. Przerzutnik typu T (ang. trigger) zmienia swój stan w czasie impulsu 
zegarowego, jeżeli T= 1 i pozostaje w stanie pierwotnym, gdy T=0. 


Na rysunku D.13 przedstawiono oznaczenia wszystkich 4 przerzutników, ich tablice 


przejść i wyjść oraz tablice wzbudzeń wymuszających odpowiednie przejścia ze stanu do 
stanu. 


DODATEK B 


W niniejszym dodatku pokrótce przedstawiono trzy procesory produkowane przez trzy 
czołowe światowe firmy. Pierwszy opisany procesor (68000 firmy Motorola) będzie przed- 
stawicielem mikroprocesorów, czyli stosunkowo prostych procesorów o niewielkiej mocy 
obliczeniowej, ale stosowany powszechnie w komputerowych systemach pomiarowych 
i w systemach automatyki. Drugim opisanym procesorem będzie mikroprocesor (Pentium 
firmy Intel) stosowany w komputerach osobistych typu IBM PC. Trzeci procesor (Alpha 
firmy DEC) jest procesorem stosowanym w komputerach stosunkowo dużej mocy oblicze- 
niowej produkowanych przez firmę DEC (Digital Equipement Corporation). Przedstawione 
opisy nie stanowią pełnej charakterystyki omawianych procesorów a mają jedynie charak- 
ter poglądowy. Zainteresowanego Czytelnika odsyła się do odpowiedniej literatury, a szcze- 
gólnie do opisów firmowych. 


B.1. MOTOROLA 68000 


Mikroprocesor M68000 jest pierwszym z serii procesorów 16- i 32-bitowych produkowa- 
nych przez firmę Motorola. Seria ta stanowi następstwo 8-bitowego procesora M6800. 
Mikroprocesor 68000 jest wykonywany jako układ scalony w obudowie z 64 wyprowa- 
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Rysunek D.14. Architektura mikroprocesora M68000 
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dzeniami. Mikroprocesor wykonuje programy w dwóch trybach pracy: jeden tryb jest 
przeznaczony dla programów użytkownika (ang. user mode) a drugi dla programów 
systemu operacyjnego (ang. superviser mode). Stan procesora wskazujący na aktualny 
tryb jest sygnalizowany trzema liniami wyjściowymi, które mogą służyć do rozróżnienia 
obszarów pamięci (pamięć programów i pamięć danych użytkownika oraz pamięć 
programów i pamięć danych systemu operacyjnego). 


Procesor zawiera dwa bloki rejestrów 32-bitowych po 8 rejestrów każdy (rys. D.14). 
Pierwszy blok jest przeznaczony dla danych, a drugi dla adresów. Dostęp do bloku danych 
(odczyt i zapis) może odbywać się bajtami, słowami 16-bitowymi i całym pełnym słowem 
32-bitowym. Dostęp do bloku adresów jest możliwy słowami 16- i 32- bitowymi. Rejestry 
adresowe mogą być używane jako rejestry bazowe i indeksowe. Niezależnie od rejestrów 
danych i adresowych procesor zawiera 32-bitowy licznik rozkazów, dwa 32-bitowe rejestry 
wskaźnika stosu (po jednym dla każdego trybu pracy) i 16-bitowy rejestr stanu. 


Połączenia procesora z innymi układami dokonuje się poprzez wyprowadzone jego 
końcówki. Na rysunku D.15 pokazano sygnały wejściowe i wyjściowe tego procesora 
wyprowadzone na zewnątrz. Sygnały adresowe są wyprowadzone 23 liniami szyny 
adresowej, co pozwala adresować 16 MB przestrzeń adresową. Transmisje danych do 
i z procesora przebiegają 16 liniami szyny danych. Sterowanie transmisjami zapewniają 
sygnały strobów: adresu (AS), zapisu i odczytu (R/W) oraz zakończenia transmisji (DATC). 
Odpowiednie kombinacje strobów danych (UDS i LDS) wskazują na dostęp do mniej lub 
bardziej znaczącego bajtu na szynie danych. Słowo stanu (FCO0—FC2) wskazuje na rodzaj 
cyklu maszynowego (rozkaz lub dana użytkownika, rozkaz lub dana systemu operacyjnego, 
cykl przerwania). Trzy linie wejściowe IPL0-IPL2 służą do przesłania sygnałów przerwań 
od urządzeń zewnętrznych. Jest 8 priorytetów, które są przyznawane urządzeniom i one 
zgłaszając przerwanie wysyłają numer swojego priorytetu. Przerwania te mogą być masko- 
wane bitami w rejestrze stanu (oprócz przerwania o najwyższym priorytecie). Przerwania 
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Rysunek D.15. Wyprowadzenia sygnałów mikroprocesora M68000 
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są sytuacjami wyjątkowymi i wraz z innymi (błędy adresowania, nielegalna instrukcja, 
próba dzielenia przez zero itp.) mają przyporządkowane sobie słowo adresowe (wektor). 
Wszystkie wektory, w liczbie 256, stanowią tablicę, która umieszczona jest w pamięci 
poczynając od adresu 0. 


Procesor ma wbudowany mechanizm do pracy wieloprocesorowej polegający na tym, 
że przyjmuje sygnał żądania zwolnienia magistrali (BR) wysyłany przez inny moduł, 
który chce sterować transmisjami na szynie. Po zakończonym cyklu maszynowym procesor 
zwalnia szynę sygnalizując ten fakt sygnałem (BG). Moduł, który przejmuje sterowanie 
szyną potwierdza to sygnałem (BGACK). 


Procesor ma także wbudowany mechanizm współpracy z modułami (pamięci i urzą- 
dzenia zewnętrzne) projektowanymi dla jego 8-bitowych poprzedników. Dlatego został 
wyposażony w linie sterowania szyną mikroprocesora M6800 (E, VMA i VPA). Pozostałe 
sygnały to: 

— dwukierunkowa linia RESET dla inicjalizacji pracy procesora (wejściowy sygnał) 
lub dla inicjalizacji pracy urządzeń zewnętrznych podczas wykonywania rozkazu 
RESET (wyjściowy sygnał), 

— dwukierunkowa linia HALT jest przeznaczona do zatrzymania pracy procesora 
(sygnał wejściowy) lub do sygnalizacji zatrzymania procesora np. przez wykrycie 
błędu transmisji (sygnał wyjściowy), 

— linia wejściowa BERR wskazująca procesorowi zaistniały błąd transmisji na ma- 
gistrali. 


Lista rozkazów procesora zawiera 56 typów rozkazów, które można wykorzystywać 
w różnych trybach adresowania. Istnieje 6 podstawowych trybów adresowania: 

— rejestrowe (dla danych i adresów), 

— rejestrowe wykorzystujące rejestry specjalne (PC, SP, rejestr stanu), 

— bezpośrednie (krótkie i długie), | 

— względne (w trybie prostym względem licznika rozkazów, a w trybie złożonym 

względem licznika i indeksu), 
— pośrednie (rejestrowym i złożonym), 
— natychmiastowe. 


B.2. PENTIUM 


Procesor Pentium został opracowany jako przedłużenie linii mikroprocesorów firmy Intel 
znanych jako 8086, 80286, 80386 i 80486. Procesory te są wykorzystywane w komputerach 
osobistych zgodnych ze standardem IBM PC. Procesor Pentium jest produkowany jako 
układ scalony w obudowie z 273 wyprowadzeniami. 


Procesor składa się z następujących bloków (rys. D.16): 

— podwójnego bloku ALU wraz z układem potoku instrukcji, 
— jednostki arytmetycznej zmiennopozycyjnej, 

— podwójnej pamięci kieszeniowej (dla rozkazów i danych), 
— układu prognozowania adresu skoku, 

— układu stronicowania, 

— bloku łącza z magistralą, 

— układu sterowania. 


B.2. Pentium 189 


Pamięć Pamięć 
kieszeniowa kieszeniowa 


programu 8kB danych 8 KB 


Układ 
Szyna stronico- 
adresowa wania 
ia Układ sterowania 
Szyna 
danych 


Zestaw 
rejestrów 


Układ | Układ ein 
ster. ster. east 
potokiemipotokiem pozycyjnych 


Rysunek D.16. Architektura mikroprocesora PENTIUM 


Układy potokowania umożliwiają realizację dwóch 5-stopniowych potoków rozkazów. 
Rozwiązanie to umożliwia wykonywanie dwóch rozkazów jednocześnie (istnieją pewne 
ograniczenia) i dlatego w czasie jednego cyklu maszynowego otrzymuje się dwa wyniki. 
Potokowanie umożliwia jednoczesne: 

l) pobieranie rozkazów, 

2) dekodowanie rozkazów, 

3) obliczanie i generację adresów, 

4) wykonywanie rozkazów, 

5) przesłanie wyniku operacji i ewentualne modyfikowanie stanu procesora. 


Zmiennopozycyjna jednostka ALU ma 8-stopniowe potokowanie. Trzy pierwsze stopnie 
potoku są takie same jak już opisane, a pozostałe to: 

4) odczyt zawartości pamięci i rejestrów, 

5) konwersja formatu liczb zmiennopozycyjnych (z formatu przechowywanego 

w pamięci do formatu ALU), 

6) wykonanie rozkazu, 

7) zapisanie wyniku operacji, 

8) sygnalizacja błędu i ewentualne modyfikowanie stanu procesora. 


Pamięć kieszeniowa Pentium jest podzielona na dwie części po 8 KB każda. Jedna część 
jest przeznaczona dla danych a druga dla rozkazów. W pamięci kieszeniowej zastosowano 
zmodyfikowaną metodę skojarzeniową dla odwzorowania jej zawartości z zawartością 
pamięci operacyjnej. Pamięć jest podzielona na 128 linii po dwa bloki każda. Każdy blok 


zawiera 32 B oraz etykietę. Wymiana zawartości pamięci jest dokonywana według meto- 
dy LRU. 


Układ prognozowania adresów skoków wykorzystuje rejestr adresu skoku, w którym 
pamiętany jest adres ostatniego skoku. Algorytm prognozowania wykorzystuje fakt, że 
najczęściej w pętli powtarzany jest ten sam adres. Oczywiście wyjście z pętli powoduje, 
że przewidywanie będzie chybione i potok będzie zatrzymany i uruchamiany ponownie. 
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Układ stronicowania umożliwia pracę ze stronami o pojemności 4 KB lub 4 MB. 
Układ ten zawiera rejestr konwersji adresów TLB (ang. translation lookaside buffer), 
który umożliwia konwersję adresu liniowego na adres fizyczny. 


Układ sterowania zapewnia oprócz poprawnej pracy samego procesora, odpowiednie 
połączenie procesora z otoczeniem. Przyjmuje wejściowe sygnały sterujące i generuje 
sygnały wyjściowe, jak np. sygnały inicjalizacji (RESET i INIT), sygnały przerwań (INTR 
i NMI), sygnały arbitrażu (BREQ, BOFF, HOLD, HLDA), stroby dostępu do pamięci 
iurządzeń zewnętrznych. Pełny opis sygnałów zająłby zbyt wiele miejsca i dlatego po- 
minięto go tutaj. 


B.3. ALPHA 


Procesor Alpha opracowano w firmie Digital Equipement Corporation do produkowanych 
przez nią komputerów VAX. Jedną z wersji jest 64-bitowy procesor produkowany w obu- 
dowie 431-końcówkowej i zasilany napięciem 3,3V. Procesor jest wykonywany bardzo 
nowoczesną technologią CMOS w rastrze 0,75 um. Szybkość pracy wyznacza zegar 
o częstotliwości 200 MHz, a ponieważ rozkazy są jednocyklowe, to czas cyklu rozkazo- 
wego wynosi 5ns. Architektura procesora jest typu RISC. Procesor wykonuje 168 
rozkazów o formacie 32-bitowym. Argumenty rozkazów mogą być 8-, 16-, 32- 1 64- 
-bitowe, gdy są liczbami całkowitymi i 32- lub 64- bitowe, gdy są liczbami zmienno- 
pozycyjnymi. 


Na rysunku D.17 pokazano schemat blokowy procesora. Wyróżniono na nim 
następujące bloki: 

— jednostkę centralną CPU, 

— sterownik pamięci, 

— sterownik urządzeń we/wy, 

— sterownik łącza szeregowego z pamięcią ROM. 


Jednostka centralna CPU składa się z następujących bloków: 
— układu sterowania pobieraniem i dekodowaniem rozkazów, 
— bloku ALU dla liczb stałopozycyjnych, 
— bloku ALU dla liczb zmiennopozycyjnych, 
— bloku współpracy z pamięcią, 
— bloków pamięci kieszeniowych. 
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Rysunek D.17. Architektura mikroprocesora ALPHA 
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Układ sterowania zawiera blok pobierania i dekodowania rozkazów, licznik rozkazów PC, 
bufor translacji adresów i sterowanie potokiem rozkazów. Procesor generuje 64-bitowy 
adres (taka jest pojemność licznika rozkazów). Fizyczna przestrzeń adresowa wynosi 
256 TB (adres 48-bitowy) i jest podzielona na 4 równe obszary. Adres wirtualny wy- 
korzystuje 43 bity, co pozwala na adresowanie 8 TB. Pamięć jest stronicowana i adres 
wirtualny jest zamieniany na adres fizyczny poprzez tablice stron. Każda strona pamięci 
może mieć zastrzeżony dostęp. Struktura przetwarzania jest zorganizowana potokowo. 
Potoki sterowania, instrukcji stałopozycyjnych i odwołań do pamięci są 7-stopniowe, 
a potok operacji zmiennopozycyjnych jest 10-stopniowy. W każdym cyklu maszynowym 
procesor wykonuje jednocześnie dwie instrukcje. Podobnie jak Pentium procesor Alpha 
jest wyposażony w układ przewidywania adresów skoków. Jest on wykorzystywany dla 
rozkazów skoków „w tył . Specjalny bit w rejestrze stanu informuje o tym, czy następna 
po danym rozkazie instrukcja skoku o danym adresie była już wykonywana. 


Blok ALU dla operacji stałopozycyjnych zawiera sumator, multiplikator i układ szyb- 
kiego przesuwania. Blok ten współpracuje z 32 rejestrami 32-bitowymi, w których prze- 
chowywane są argumenty stałopozycyjne. Blok ALU dla operacji zmiennopozycyjnych 
zawiera sumator, multiplikator i układ dzielenia. Blok ten współpracuje z 32 rejestrami 
32-bitowymi, w których przechowywane są argumenty zmiennopozycyjne. 


Blok współpracy z pamięcią składa się z 4 części: 

— bufora translacji danych, który na podstawie zawartego w rozkazie przemieszcze- 
nia generuje efektywny adres rozkazu zamieniany następnie na adres fizyczny, 

— układu odczytu i zapisu pamięci, który odpowiada za potokowanie rozkazów 
przesłań pomiędzy pamięcią operacyjną i pamięcią kieszeniową, 

— bufora zapisu umożliwiającego przyspieszanie zapisu do pamięci przez tworzenie 
32-bajtowych bloków odpowiadających blokom w pamięci kieszeniowej, 

— wewnętrznych rejestrów procesora. 


Pamięć kieszeniowa jest podzielona na dwie części: jedna dla rozkazów i druga dla 
danych. Każda z tych pamięci ma pojemność 8 KB. Dla odwzorowania zawartości pamięci 
kieszeniowej i pamięci operacyjnej zastosowano metodę bezpośrednią, a dla aktualizacji 
zawartości obu pamięci metodę zapisu bezpośredniego. 


Sterownik pamięci zapewnia poprawność łącza pomiędzy procesorem i dynamiczną 
pamięcią operacyjną, a także pamięcią VRAM (videoRAM), która służy do współpracy 
procesora z monitorem graficznym. Podobną rolę w stosunku do urządzeń zewnętrznych 
pełni sterownik urządzeń we/wy. 


Procesor jest wyposażony w szeregowe łącze pamięci ROM, które służy do załado- 
wania systemu w czasie inicjalizacji pracy lub do celów diagnostycznych. Diagnostykę 
zapewniają układy BIST (ang. build-in self test) służące do samotestowania układu. 


Ciekawym rozwiązaniem jest wprowadzenie zbioru procedur zwanych uprzywilejo- 
wanymi kodami bibliotecznymi (ang. privilleged architecture library code — PALcode). 
Projektanci procesora zdecydowali się na takie rozwiązanie ponieważ zbyt droga okazała 
się realizacja sprzętowa niektórych funkcji, jak np. wywoływanie powtarzających się 
długich ciągów rozkazów. Funkcje kodu PAL są wywoływane sprzętowo lub za pomocą 
specjalnego rozkazu CALL PAL. 
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adres efektywny 82 

— przeznaczenia 65 
adresowanie względne 84 
akumulator 62 

algorytm Bootha 51 

— FCFS 151 

— Round-Robin 152 

— SJF 152 

alokacja 143 

arbiter 165 

architektura potokowa 162 
— przepływowa 158 

— równoległa 162—163 

— typu Harvard 161 
arytmometr 71 

asembler 144 

asemblery z tablicą adresów 145 
— — przypisań 146 

automat asynchroniczny 183 
— Mealy'ego 182 

— Moore'a 182 

automaty synchroniczne 183 


bajt 9, 85 

baza 82 

bazowy tryb adresowania 83 
bezpośredni dostęp do pamięci 68, 114 
bit parzystości 37 

bity ochrony 59 

blok arytmetyczno-logiczny ALU 8, 69 
— sterujący 149 

bramka 14 

bramki trzystanowe 15 

— typu OC 15 
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cecha 56 

ciało podprogramu 140 
CISC 164 

CPU 62 

cykl instrukcyjny 12, 65 
— maszynowy 12, 65 

— odczytu pamięci 65 

— rozkazowy 65 


— pobrania kodu rozkazu 65 


— zapisu do pamięci 65 
cylinder 109 

czas cyklu 86 

— dostępu 63, 85 
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dekoder 22 
dekodowanie liniowe 24 
— matrycowe 24 
demultiplekser 27 
dostęp z przeplotem 161 


edytor 147 
egzekutor 149 
enkoder 25 
epilog 140 


F 
funkcja (podprogram) 139 


H 


Hazard 178 


194 


iloczyn logiczny 172 
instrukcja 7 
interpeter 147 
implicent 174 
implikant 174 
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jądro systemu operacyjnego 150 
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kanał multiplekserowy 137 

— selektorowy 137 

— wejścia-wyjścia 137 

kanoniczna postać alternatywna 174 

— — funkcji 174, 

— — koniunkcyjna 174 

kod „2 z 5” 37 

— ASCII 39 

— binarny 36, 175 

— Graya 36, 176 

— korekcyjny 37 

— Manchester 128 

— nadmiarowy 36 

— siedmiosegmentowy 26 

— szesnastkowy 37 

— „z nadmiarem 3 37 

koder 25 

kody nadmiarowe 36 

kolejka 148, 150-152, 160 

komparator 19 

kompilator 147 

komputery sterowane przepływem da- 
nych 171 

— systoliczne 170 

komunikat 130 

konwertery kodu 25 

kradzież cykli 136 
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licznik 32-33 
— łańcuchowy 33 
— następnikowy 34 
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licznik pierścieniowy 32 
— poprzednikowy 34 

— rewersyjny 34 

— rozkazów 9, 62 

— synchroniczny 34 

— w kodzie Johnsona 32 
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łańcuchowy układ przerwań 119 
łącza 113 

— urządzenia zewnętrznego 113, 123 
łącze dupleksowe 123 

— półdupleksowe 123 

— równoległe 123 

— szeregowe 123 
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magistrala 62 

— lokalna 168 

— systemowa 168 
mantysa 55 

mapa Karnaugha 174 
MFLOPS 5 
mikrooperacja 70 
MIPS 5 

modem 126 
monitor 148 
multiplekser 27 


negacja 172 
notacja polska 79 


0 


odejmowanie 41 
odrzucanie 59 
operand 65, 76 
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pamięci asocjacyjne 87—88 
— dynamiczne 92 
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pamięci dyskowe 87, 108 

— operacyjne 2, 88, 96 

— pomocnicze 2 

— RAM 87 

— ROM 87, 92 

— statyczne 92 

— wirtualne 153 

— z dostępem cyklicznym 87, 106 

— z dostępem sekwencyjnym 87 

— z dostępem swobodnym 87 

— zewnętrzne 2 

pamięć buforowa typu FIFO 160 

— kieszeniowa 86, 99 

— masowa 85 

— rejestrowa 86 

— typu 2D 89 

— typu 3D 89 

— zewnętrzna 86 

plik 147 

pobranie argumentu 11 

— rozkazu 11 

podprogramy 139 

podział pamięci 153 

pojemność pamięci 9, 85 

pole etykiety 144 

— komentarza 144 

— rozkazu 144 

praca krokowa 115 

— w trybie pułapki 115 

— — śledzenia 115 

priorytet 117 

procedura 139 

proces 149 

program 7 

— łączący 145 

— szeregujący zadania 148 

— wspomagający uruchamianie 147 

— wynikowy 145 

— źródłowy 145 

programowa obsługa urządzeń zewnętrz- 
nych 114 

prolog 140 

protokół BISYNC 134 

— HDLC 130 

przeglądanie 118 

przekazanie parametrów 143 


przemieszczenie 82 
przerwania 63, 114 
przesunięcie 82 

przerzutnik 184 

przetwarzanie interakcyjne 147 
przetwarzanie wsadowe 147 
przyłączanie podprogramu 140 
pseudorozkaz 144 


ramka 130 

rejestr 30 

— przesuwający 31 
— rozkazów 9, 62 
— znaczników 62 
relokacja 146 
RISC 163 

rozkaz 7 


S 


segmentacja pamięci 153 
sektor 85, 109 

sekwencja czyszcząca 140 

— startowa 140 

słowo kontrolne CRC 39 
sterownik 113 

— łącza równoległego 123—124 
— łącza szeregowego 123, 126 
stronicowanie 153, 154 

suma logiczna 172 

— na drucie 15 

sumator 16, 17 

sumowanie 16 

sygnał inicjalizacji 63 

— pracy krokowej 63 

— przerwania 63 

— wstrzymania 63 

system funkcjonalnie pełny 179 
— operacyjny 3, 116, 146 

— plików 147 

— priotytetowy przerwań 117 


systemy czasu rzeczywistego 116 


— silnie powiązane 165 
— słabo powiązane 165 


195 


196 
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systemy wieloprocesorowe 165 
— wieloprogramowe 116 

— z podziałem czasu 147 
szeregowanie krótkoterminowe 148 
— wysokiego poziomu 148 

— zleceń wejścia-wyjścia 149 
szyna adresowa 62 

— danych 62 

— sterująca 62 

sytuacja wyjątkowa 115 
szybkość transmisji 85 


T 


tabela prawdy 174 

technika potokowa 156 

tetrada 4] 

translator 144 

transmisja asynchroniczna 126 

— bezpośredniego dostępu do pamię- 
ci 68, 114 

— bitowa 130 

— blokowa 114, 136 

— synchroniczna 127 

— z potwierdzeniem 125 

transmisja znakowa 134 

tryb adresowania bezpośredniego 81 

— adresowania indeksowego 82 

— adresowania pośredniego 81 

— bazowy 83 

— natychmiastowy 81 

— rejestrowy 81 


tryb rejestrowy pośredni 81 
tryby adresowania 81 


U 


układ iteracyjny 17 

— kombinacyjny 14 

— przerwań z koderem priorytetowym 119 
— sekwencyjny 14, 29 

układy mikroprogramowane 73 


W 


wektor przerwań 119 
wielopoziomowy system przerwań 118 
wieloprogramowość 147 

wstrzymanie 63, 68 

wykładnik 55 

wykonanie rozkazu 8 

wymiana zawartości pamięci 153 
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zadanie 149 

zagnieżdżanie podprogramów 142 
— przerwań 119 

zaokrąglanie 58 

zapis U1 40 

— U2 40 

— zmiennopozycyjny 55—56 

— znak-moduł 40 

zarządzanie pamięcią 148 
znaczniki 63 


